Еще больше материалов по Data Science и машинному обучению: от логики и риторики до теории множеств и матанализа

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Привет, Хабр! Меня все еще зовут Ефим, и я все еще MLOps-инженер в отделе Data- и ML-продуктов Selectel. В предыдущей статье я кратко рассказал про основные ресурсы, которые могут помочь начинающему специалисту ворваться в бурлящий котел Data Science. Но после выхода материала я понял, что задача систематизации знаний гораздо сложнее, чем казалось. Настолько, что проиллюстрировать ее можно только табличкой ниже:


В этом тексте хочу исправиться: разбить знания по Data Science и машинному обучению на несколько теоретических блоков и дать больше полезных материалов. Подробности под катом!

Подборка объемная. Используйте навигацию, если не хотите изучать все темы:

→ Введение в проблематику
→ Вы — строитель, факты — ваши материалы, а логика — ваш молоток
→ Один — это я, два — это теленок, три — это корова, 123! — это 1.21463e+205
→ Весь мир — множество, а люди в нем — элементы
→ Объекты не столь существенны, важны их отношения
→ Бесконечность — не предел, не мера и не норма
→ Заключение

Введение в проблематику


По следам первой статьи


Для начала хотелось бы поблагодарить всех за интересные комментарии к первой статье. Было приятно пообщаться, изучить рекомендации, которые вы давали, и в целом коммуницировать с сообществом Хабра. Спасибо!

Если у вас есть идеи, как можно улучшить эту статью, — пишите в комментариях. За лучшее предложение мы отправим плюшевого тирекса и другой мерч Selectel.

О численной оптимизации и других сложных темах


Хотелось бы отдельно поговорить о некоторых мыслях, которые промелькнули в комментариях. В частности — о необходимости разговора о методах численной оптимизации. В статье про Data Science. Для начинающих.

Мне кажется, что на первых порах это слишком сложный раздел математики. Ведь чтобы научиться бегать, необходимо сначала научиться ходить, а перед этим — ползать. Но именно это замечание натолкнуло меня на мысль, что задача написать статью о том, как основательно подойти к своему профессиональному развитию в Data Science, далеко не так проста, как изначально казалось. На пути специалиста слишком много локальных экстремумов, а ландшафт ошибки, по которому приходится бродить, слишком ухабист.

При этом нет худа без добра. Я нашел для себя довольно любопытный курс по численным методам для инженеров от профессора университета Гонконга. Во втором видео говорится об ошибке округления, по поводу которой в комментариях дали хорошую ссылку. Уже в третьем видео автор курса рассказывает о стандарте IEEE, как в нем представлены числа, какие из них резервируются и т.д. А дальше уже есть видео и про методы Рунге-Кутта (ссылка, ссылка, ссылка).

Безусловно, понимание численных методов важно, если хочется знать, что происходит под капотом. Можно, например, вооружиться вот такой книжкой и уйти в тибетский монастырь на пару лет, чтобы от корки до корки ее прочесть. Можно попробовать пройти вот такой курс.

Все это, тем не менее, лежит далеко за пределами уровня новичка. Поэтому я не включаю численную оптимизацию в свои подборки. Хочется-то другого. Хочется ровно того, о чем пишет в своей книге (о ней будет ниже) Михаил Юрьевич Пантаев:


Михаил Юрьевич Пантаев, математик

«… адресат… — человек, отчасти напуганный математикой (а таково большинство студентов технических вузов средней руки), которому я бы хотел протянуть… гм… руку помощи. Нежную, понимающую руку».

Вот чего хочется. Помощи. Простой и человеческой. Я не тот, кто может ее оказать, но это могут сделать те, чьи книги, статьи и другие материалы будут подсвечены в этой статье.

У нас мало времени, нам не изучить все дисциплины!



Времени всегда мало, оно вечно куда-то ускользает. Между тем, сколько бы я ни пытался уложить различные разделы математики в единую картину, я нахожусь примерно там же, где был несколько лет назад.

Сбор материалов и работа над статьей помогли понять, что систематизация математики — это далеко не только моя проблема. Сравнительно недавно я наткнулся на доказательства данной мысли. Вот, например, что пишет или пишут (если вы понимаете, о чем я) Никола Бурбаки в своей статье «Архитектура математики»:

«…оказывается, что каждый год математическая наука обогащается массой новых результатов, приобретает все более разнообразное содержание и постоянно дает ответвления в виде теорий, которые беспрестанно видоизменяются, перестраиваются, сопоставляются и комбинируются друг с другом. Ни один математик не в состоянии проследить это развитие во всех подробностях, даже если он посвятит этому всю свою деятельность.

Многие из математиков устраиваются в каком-либо закоулке математической науки, откуда они и не стремятся выйти, и не только почти полностью игнорируют все то, что не касается предмета их исследований, но не в силах даже понять язык и терминологию своих собратьев, специальность которых далека от них. Нет такого математика, даже среди обладающих самой обширной эрудицией, который бы не чувствовал себя чужеземцем в некоторых областях огромного математического мира; что же касается тех, кто подобно Пуанкаре или Гильберту оставляет печать своего гения почти во всех его областях, то они составляют даже среди наиболее великих редчайшее исключение».

Нет, не изучить. Но мы будем пытаться все равно!



Пусть мы и не можем изучить всю математику, это не означает, что нужно прекращать попытки, ибо как гласит предисловие Рихарда Куранта в книге «Что такое математика»:

«На протяжении двух с лишним тысячелетий обладание некоторыми, не слишком поверхностными, знаниями в области математики являлось необходимой составной частью интеллектуального багажа каждого образованного человека».

Следовательно, если говорить об основательном подходе, то погружение в математику — это процесс, длиною, возможно, в целую жизнь. Станете ли вы при этом Head of Data Science department, получите ли ярлычок Competition Grand Master на Kaggle, возглавите ли кафедру по машинному обучению в своем университете — так ли это важно для вас?

Важнее ли для вас добиться какого-то выдающегося результата в этом деле или же радоваться тому, что находитесь на пути своего развития? Я не знаю, вам виднее. Для себя я более-менее все решил — поэтому «ковыряюсь» в книгах и пишу об этом.

Какой бы соблазнительной ни была идея остаться сугубо в процессе изучения математики, нужно признать: любой процесс с чего-то начинается. В нашем случае стоит начать с того, что позволяет нам обоснованно и непротиворечиво рассуждать. С чего именно — догадайтесь по фото:


Мужчина на фотографии довольно много говорил об этом в свое время. Конечно, он тогда еще не ходил с такой прической. Учитывая то, откуда эта фотография, он наверняка никогда не ходил с такой прической. Тем не менее, уж кто-кто, а он очень хорошо умел рассуждать. Догадались? Тогда можно идти дальше.


Вы — строитель, факты — ваши материалы, а логика — ваш молоток


На самом деле, не только логика. В один ряд с ней можно поставить риторику, теорию аргументации, когнитивистику, философию, историю и другое. Казалось бы, какое это отношение имеет к математике? Как говорил один математик устами своего безумного персонажа: «Что общего между вороном и письменным столом?»

Вопрос риторический.
Источник: https://habr.com/ru/companies/selectel/articles/762098/


Интересные статьи

Интересные статьи

Как программисты, вы должны постоянно учиться. Вы изучаете учебники, документацию, вопросы по Stack Overflow — всё, что можно найти и что может помочь вам писать код и поддерживать актуальность своих ...
Всем привет! Продолжаем дайджесты новостей и других материалов о свободном и открытом ПО и немного о железе. Всё самое главное про пингвинов и не только, в России и мире. Продолжение к...
Привет, Хабр! Чуть больше недели назад мы выпустили новую версию нашей IDE для Go — GoLand 2020.1. Если кратко, в этот релизный цикл мы сфокусировались над расширением текущей поддержки Go...
Привет, этим постом мы хотим вызвать тимлидов на разговор. А точнее, запустить проект “ТимлидПозвонит”, в котором раз в две-три недели наши Петр anotherpit, Кирилл flashhhh и Артем arasskosov буд...
Предлагаем вашему вниманию подборку с ссылками на новые материалы из области фронтенда и около него.