Всеки един курс за машинно обучение в интернет, класиран по вашите отзиви

Дървен робот от Kaboompics

Преди година и половина се отказах от една от най-добрите програми за компютърни науки в Канада. Започнах да създавам собствена магистърска програма за наука за данни, използвайки онлайн ресурси. Разбрах, че мога да науча всичко необходимо чрез edX, Coursera и Udacity. И бих могъл да го науча по-бързо, по-ефективно и за малка част от разходите.

Вече почти приключих. Взех много курсове, свързани с научните данни и одитирани части от много други. Знам опциите там и какви умения са необходими на учащите се да се подготвят за анализатор на данни или роля на учен за данни. Затова започнах да създавам ръководство за преглед, което препоръчва най-добрите курсове за всеки предмет в рамките на науката за данни.

За първото ръководство от поредицата препоръчах няколко класа кодиране за начинаещия учен с данни. Тогава това бяха класове по статистика и вероятност. След това запознаване с науката за данните. Също така визуализация на данни.

Сега към машинното обучение.

За това ръководство прекарах десетина часа, опитвайки се да идентифицирам всеки онлайн курс за машинно обучение, предлаган от май 2017 г., извличайки ключови битове информация от техните учебни програми и рецензии и съставях оценките им. Крайната ми цел беше да идентифицирам трите най-добри налични курса и да ви ги представя по-долу.

За тази задача се обърнах към никой друг, освен с отворен код Класната общност с отворен код и нейната база данни с хиляди оценки и отзиви за курсове.

Началната страница на Class Central

От 2011 г. основателят на Class Central Dhawal Shah следи по-внимателно онлайн курсовете, отколкото може би някой друг в света. Dhawal лично ми помогна да сглобя този списък с ресурси.

Как избрахме курсове за разглеждане

Всеки курс трябва да отговаря на три критерия:

  1. Трябва да има значително количество съдържание за машинно обучение. В идеалния случай машинното обучение е основната тема. Имайте предвид, че курсовете само за дълбоко обучение са изключени. Повече за това по-късно.
  2. Той трябва да бъде по поръчка или да се предлага на всеки няколко месеца.
  3. Трябва да е интерактивен онлайн курс, така че да няма книги или уроци само за четене. Въпреки че това са жизнеспособни начини за учене, това ръководство се фокусира върху курсовете. Курсовете, които са строго видеоклипове (т.е. без тестове, задачи и т.н.), също са изключени.

Вярваме, че покрихме всеки забележителен курс, който отговаря на горните критерии. Тъй като привидно има стотици курсове за Udemy, избрахме да разгледаме само най-прегледаните и най-високо оценените.

Винаги има шанс да сме пропуснали нещо. Така че, моля, уведомете ни в секцията за коментари, ако оставихме добър курс.

Как оценявахме курсовете

Съставихме средни оценки и брой отзиви от Class Central и други сайтове за преглед, за да изчислим среднопретеглена оценка за всеки курс. Прочетохме текстови рецензии и използвахме тази обратна връзка, за да допълним числовите оценки.

Направихме субективни призиви за преценка на учебната програма въз основа на три фактора:

  1. Обяснение на процеса на машинно обучение. Курсът очертава ли стъпките, необходими за изпълнение на успешен проект за МЛ? Вижте следващия раздел за това, което включва типичен работен процес.
  2. Покритие на техниките и алгоритмите за машинно обучение. Обхващат ли се различни техники (например регресия, класификация, групиране и др.) И алгоритми (например в рамките на класификацията: наивни Bayes, дървета на решения, машини за поддръжка на вектори и т.н.) или само няколко избрани? Предпочитание се дава на курсове, които обхващат повече, без да се прескачат подробности.
  3. Използване на общи инструменти за научни данни и машинно обучение. Курсът се преподава с използване на популярни езици за програмиране като Python, R и / или Scala? Какво ще кажете за популярните библиотеки в рамките на тези езици? Те не са необходими, но е полезно, тъй че на тези курсове се дава леко предпочитание.

Какво е машинно обучение? Какво е работен процес?

Популярна дефиниция произлиза от Артур Самуел през 1959 г.: машинното обучение е подполе на компютърните науки, което дава на „компютрите възможност да учат, без да са изрично програмирани.“ На практика това означава разработване на компютърни програми, които могат да правят прогнози въз основа на данни. Точно както хората могат да се учат от опит, така и компютрите, където данните = опит.

Машинен работен поток е процесът, необходим за осъществяване на проект за машинно обучение. Въпреки че отделните проекти могат да се различават, повечето работни процеси споделят няколко общи задачи: оценка на проблемите, проучване на данни, предварителна обработка на данни, обучение / тестване / внедряване на модели и др. По-долу ще намерите полезна визуализация на тези основни стъпки:

Основните стъпки на типичния машинен процес на обучение чрез UpX Academy

Идеалният курс представя целия процес и предоставя интерактивни примери, задания и / или викторини, при които студентите могат сами да изпълняват всяка задача.

Тези курсове обхващат ли задълбочено обучение?

Първо, да определим задълбоченото обучение. Ето кратко описание:

„Дълбокото обучение е подполе на машинно обучение, свързано с алгоритми, вдъхновени от структурата и функцията на мозъка, наречени изкуствени невронни мрежи.“
- Джейсън Браунли от машинно обучение

Както може да се очаква, части от някои от курсовете за машинно обучение съдържат дълбоко учебно съдържание. Реших обаче да не включва курсове само за дълбоко обучение. Ако се интересувате от задълбочено обучение, ще ви разкрием със следната статия:

Най-добрите ми три препоръки от този списък биха били:

  • Творчески приложения на задълбочено обучение с TensorFlow от Kadenze
  • Невронни мрежи за машинно обучение от Университета в Торонто (преподавани от Джефри Хинтън) чрез Coursera
  • Дълбоко обучение A-Z ™: Hands-On изкуствени невронни мрежи
    от Кирил Еременко, Хаделин де Понтевес и екипът на SuperDataScience чрез Udemy

Препоръчителни предпоставки

Няколко курсове, изброени по-долу, изискват студентите да имат предварително програмиране, смятане, линейна алгебра и статистика. Тези предпоставки са разбираеми, като се има предвид, че машинното обучение е напреднала дисциплина.

Липсват няколко предмета? Добри новини! Част от този опит може да бъде придобит чрез нашите препоръки в първите две статии (програмиране, статистика) на това ръководство за кариера на научните данни. Няколко най-високо класирани курсове по-долу също предоставят нежно смятане и линейна освежаваща алгебра и подчертават аспектите, които са най-важни за машинното обучение за тези, които не са толкова познати.

Изборът ни за най-добър курс за машинно обучение е…

  • Машинно обучение (Станфордски университет чрез Coursera)

Машинното обучение на Coursera на университета в Станфорд е ясен настоящ победител по отношение на оценките, рецензиите и учебната програма. Преподаван от известния Андрю Нг, основател на Google Brain и бивш главен учен в Baidu, това беше класът, който предизвика основаването на Coursera. Той има среднопретеглена оценка от 4,7 звезди над 422 отзива.

Издаден през 2011 г., той обхваща всички аспекти на процеса на машинно обучение. Въпреки че има по-малък обхват от оригиналния клас Станфорд, на който се основава, той все пак успява да обхване голям брой техники и алгоритми. Прогнозната времева линия е единадесет седмици, като две седмици са посветени на невронните мрежи и задълбоченото обучение. Предлагат се безплатни и платени опции.

Ng е динамичен, но нежен инструктор с осезаемо преживяване. Той вдъхва увереност, особено когато споделя практически съвети за прилагане и предупреждения за често срещани клопки. Предоставя се линейна опреснителна алгебра и Ng подчертава аспектите на смятането, най-важни за машинното обучение.

Оценяването е автоматично и се извършва чрез множество тестове за избор, които следват всеки урок и задачи по програмиране. Заданията (има осем от тях) могат да бъдат изпълнени в MATLAB или Octave, което е версия с отворен код на MATLAB. Ng обяснява своя избор на език:

В миналото се опитвах да преподавам машинно обучение, използвайки голямо разнообразие от различни езици за програмиране, включително C ++, Java, Python, NumPy, а също и Octave ... И това, което видях, след като преподавах машинно обучение почти десетилетие, е, че научаваш се много по-бързо, ако използваш Octave като своя среда за програмиране.

Въпреки че Python и R вероятно са по-убедителен избор през 2017 г. с повишената популярност на тези езици, рецензенти отбелязват, че това не бива да ви спира да вземете курса.

Няколко видни рецензенти отбелязаха следното:

От дългогодишна известност в света на MOOC, курсът за машинно обучение на Станфорд наистина е окончателното въведение в тази тема. Курсът обхваща всички основни области на машинното обучение ... Проф. Нг предхожда всеки сегмент с мотивираща дискусия и примери.
Andrew Ng е талантлив учител и умее да обяснява сложни предмети по много интуитивен и ясен начин, включително и математиката зад всички понятия. Силно препоръчително.
Единственият проблем, който виждам с този курс, ако той задава лентата на очакванията много висока за други курсове.

Ново въведение в Ivy League с блестящ професор

  • Машинно обучение (Колумбийски университет чрез edX)

Машинното обучение на Университета Колумбия е сравнително ново предложение, което е част от техните MicroMasters за изкуствен интелект на edX. Въпреки че е по-нов и няма голям брой отзиви, тези, които има, са изключително силни. Професор Джон Пейсли е отбелязан като блестящ, ясен и умен. Той има среднопретеглена оценка от 4,8 звезди над 10 отзива.

Курсът обхваща също всички аспекти на машинното обучение и повече алгоритми от горната оферта на Stanford. Колумбия е по-напреднало въведение, като рецензенти отбелязват, че студентите трябва да са удобни с препоръчителните предпоставки (смятане, линейна алгебра, статистика, вероятност и кодиране).

Тестовете за оценка са викторините (11), задачите по програмиране (4) и заключителният изпит. Студентите могат да използват или Python, Octave, или MATLAB, за да изпълнят задачите. Общият прогнозен график на курса е от осем до десет часа седмично в продължение на дванадесет седмици. Той е безплатен с проверен сертификат за закупуване.

По-долу са някои от гореспоменатите пенливи ревюта:

През всичките си години [като ученик] се натъкнах на професори, които не са блестящи, професори, които са брилянтни, но не знаят как да обяснят ясно нещата, и професори, които са блестящи и знаят как да обяснят нещата ясно. Д-р Пейсли принадлежи към третата група.
Това е чудесен курс ... Езикът на инструктора е прецизен и това е, според мен, една от най-силните точки на курса. Лекциите са с високо качество и слайдовете също са страхотни.
Д-р Пейсли и неговият ръководител са ... студенти на Майкъл Джордан, бащата на машинното обучение. [Д-р Пейсли] е най-добрият професор по МЛ в Колумбия поради способността му да обяснява ясно нещата. До 240 студенти са избрали курса му през този семестър, най-големият брой сред всички преподаватели [преподаване] машинно обучение в Колумбия.

Практическо въведение в Python & R от индустриални експерти

  • Машинно обучение A-Z ™: Hands-On Python & R In Science Science (Кирил Еременко, Хаделин де Понтевес и екипът на SuperDataScience чрез Udemy)

Машинното обучение A-Z ™ в Udemy е впечатляващо подробно предложение, което осигурява инструкции както в Python, така и в R, което е рядкост и не може да се каже за нито един от другите топ курсове. Той има среднопретеглена 4,5-звездна оценка над 8,119 отзива, което го прави най-прегледаният курс от разглежданите.

Той обхваща целия работен процес на машинно обучение и почти нелепо (по добър начин) брой алгоритми чрез 40,5 часа видео по заявка. Курсът има по-приложен подход и е по-лек по математика от горните два курса. Всеки раздел започва с "интуиция" видео от Еременко, което обобщава основната теория на концепцията, която се преподава. След това de Ponteves преминава през изпълнение с отделни видеоклипове както за Python, така и за R.

Като „бонус“ курсът включва шаблони на Python и R код, за да могат студентите да изтеглят и използват в свои собствени проекти. Има викторини и предизвикателства за домашна работа, макар че това не са силните страни на курса.

Еременко и екипът на SuperDataScience са уважавани за способността си да „правят комплекса просто.” Също така, изброените предпоставки са „просто някаква математика в средните училища“, така че този курс може да бъде по-добър вариант за онези, които са обезпокоени от предложенията на Станфорд и Колумбия.

Няколко видни рецензенти отбелязаха следното:

Курсът е професионално произведен, качеството на звука е отлично, а обясненията са ясни и сбити ... Това е невероятна стойност за вашата финансова и времева инвестиция.
Беше грандиозно да мога да проследя курса на два различни езика за програмиране едновременно.
Кирил е един от абсолютните най-добри инструктори в Udemy (ако не и в Интернет) и препоръчвам да вземете всеки клас, който преподава. ... Този курс има много съдържание, като тон!

Състезанието

Нашият избор №1 имаше среднопретеглена оценка от 4,7 от 5 звезди над 422 отзива. Нека разгледаме другите алтернативи, подредени по низходящ рейтинг. Напомняне, че курсовете само за дълбоко обучение не са включени в това ръководство - можете да ги намерите тук.

Аналитичният ръб (Масачузетски технологичен институт / edX): По-фокусиран е по принцип върху аналитика, въпреки че обхваща няколко теми за машинно обучение. Използва R. Силен разказ, който използва познати примери от реалния свят. Предизвикателен. Десет до петнадесет часа седмично през дванадесет седмици. Безплатен с проверен сертификат за закупуване. Той има среднопретеглена оценка от 4,9 звезди над 214 отзива.

Python за наука за данни и машинно обучение Bootcamp (Jose Portilla / Udemy): Има големи парчета съдържание на машинно обучение, но обхваща целия процес на наука за данни. Повече от много подробно въведение към Python. Удивителен курс, макар и не идеален за обхвата на това ръководство. 21,5 часа видео при поискване. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има среднопретеглена оценка с 4,6 звезди над 3316 отзива.

Data Science и машинно обучение Bootcamp с R (Jose Portilla / Udemy): Коментарите за горния курс на Portilla се прилагат и тук, с изключение на R. 17,5 часа видео при поискване. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има среднопретеглена оценка от 4,6 звезди над 1317 отзива.

Серия за машинно обучение (Lazy Programmer Inc./Udemy): Преподаван от учен с данни / инженер с големи данни / софтуерен инженер с пълен стек с впечатляващо възобновяване, Lazy Programmer в момента има серия от 16 курса за машинно обучение, насочени към Udemy. Общо курсовете имат 5000+ оценки и почти всички имат 4.6 звезди. Полезно подреждане на курсове е предоставено във всяко описание на всеки отделен курс. Използва Python. Цената варира в зависимост от отстъпките от Udemy, които са чести.

Машинно обучение (Georgia Tech / Udacity): Компилация от три отделни курса: Супервизиран, Ненаблюдаван и Учебно обучение. Част от инженерът за машинно обучение на Udacity Nanodegree и онлайн магистърската степен на OMS на Georgia Tech. Видеоклипове с размер на хапки, какъвто е стилът на Udacity. Приятелски професори. Прогнозна времева линия от четири месеца. Безплатно. Той има 4.56-звездна средно претеглена оценка над 9 отзива.

Внедряване на предсказуем анализ с Spark в Azure HDInsight (Microsoft / edX): Въвежда основните понятия за машинно обучение и разнообразни алгоритми. Използва няколко големи полезни за използване на данни инструменти, включително Apache Spark, Scala и Hadoop. Използва както Python, така и R. Четири часа седмично в продължение на шест седмици. Безплатен с проверен сертификат за закупуване. Той има среднопретеглена 4,5-звездна оценка над 6 отзива.

Наука за данни и машинно обучение с Python - Hands On! (Франк Кейн / Udemy): Използва Python. Кейн има девет години опит в Amazon и IMDb. Девет часа видео при поискване. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има средно претеглена оценка с 4,5 звезди над 4139 отзива.

Scala and Spark за големи данни и машинно обучение (Jose Portilla / Udemy): „Големите данни“ се фокусират, по-специално върху внедряването в Scala и Spark. Десет часа видео при поискване. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има среднопретеглена 4,5-звездна оценка над 607 отзива.

Машинното обучение инженер Nanodegree (Udacity): водеща програма за машинно обучение на Udacity, която разполага с най-добрата в класа система за преглед на проекти и кариерна подкрепа. Програмата представлява компилация от няколко индивидуални курса на Udacity, които са безплатни. Създаден от Kaggle. Прогнозна времева линия от шест месеца. Понастоящем струва 199 USD на месец с 50% възстановяване на обучение за тези, които завършват в рамките на 12 месеца. Той има средно претеглена оценка с 4,5 звезди над 2 отзива.

Учене от данни (Въвеждащо машинно обучение) (Калифорнийския технологичен институт / edX): В момента регистрацията е закрита в edX, но е достъпна и чрез независимата платформа на CalTech (вижте по-долу). Той има среднопретеглена оценка от 4,59 звезди над 42 отзива.

Учене от данни (въвеждащо машинно обучение) (Yaser Abu-Mostafa / Калифорнийския технологичен институт): „Истински курс на Калтех, а не напоена версия.“ Отзивите отбелязват, че е отличен за разбиране на теорията на машинното обучение. Професорът Ясер Абу-Мостафа е популярен сред студентите и също така е написал учебника, на който се основава този курс. Видеоклиповете са лекции с касета (с диапозитиви за снимки на лекции), качени в YouTube. Задачите за домашна работа са .pdf файлове. Обучението в курса за онлайн студенти не е толкова излъскано, колкото първите три препоръки. Има среднопретеглена оценка от 4,43 звезди над 7 отзива.

Извличане на масивни набори от данни (Станфордски университет): Машинно обучение с акцент върху „големи данни“. Въвежда съвременни разпределени файлови системи и MapReduce. Десет часа седмично над седем седмици. Безплатно. Той има среднопретеглена оценка от 4,4 звезди над 30 отзива.

AWS Машинно обучение: Пълно ръководство с Python (Chandra Lingam / Udemy): Уникален акцент върху облачното базирано машинно обучение и конкретно Amazon Web Services. Използва Python. Девет часа видео при поискване. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има средно претеглена оценка от 4,4 звезди над 62 отзива.

Въведение в машинното обучение и разпознаването на лица в Python (Holczer Balazs / Udemy): Използва Python. Осем часа видео по заявка. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има среднопретеглена оценка от 4,4 звезди над 162 отзива.

StatLearning: Статистическо обучение (Университета в Станфорд): Въз основа на отличния учебник „Въведение в статистическото обучение с приложения на R“ и преподаван от преподавателите, които го написаха. Рецензенти отбелязват, че MOOC не е толкова добър, колкото книгата, цитирайки „тънки“ упражнения и посредствени видеоклипове. Пет часа седмично над девет седмици. Безплатно. Той има среднопретеглена оценка от 4,35 звезди над 84 отзива.

Специализация на машинното обучение (Университет във Вашингтон / Coursera): Страхотни курсове, но последните два класа (включително проекта Capstone) бяха отменени. Рецензенти отбелязват, че тази серия е по-лесно смилаема (четете: по-лесна за тези без силен технически опит), отколкото другите топ-курсове за машинно обучение (например Stanford's или Caltech). Имайте предвид, че серията е непълна с препоръчителни системи, задълбочено обучение и резюме липсва. Налични са безплатни и платени опции. Той има среднопретеглена оценка от 4,31 звезди над 80 отзива.

Университетът във Вашингтон преподава специализация по машинно обучение по Coursera.

От 0 до 1: Машинно обучение, NLP & Python-Cut към гонитбата (Loony Corn / Udemy): „Приземна, срамежлива, но уверена, поема техниките за машинно обучение.“ Преподавано от екип от четири човека с десетилетия на опит в индустрията заедно. Използва Python. Цената варира в зависимост от отстъпките от Udemy, които са чести. Той има среднопретеглена 4,2-звездна оценка над 494 отзива.

Принципи на машинното обучение (Microsoft / edX): Използва R, Python и Microsoft Azure Machine Learning. Част от сертификата за професионална програма на Microsoft в областта на научните данни. Три до четири часа седмично в продължение на шест седмици. Безплатен с проверен сертификат за закупуване. Той има среднопретеглена оценка от 4.09 звезди над 11 отзива.

Големи данни: Статистически изводи и машинно обучение (Технически университет в Куинсланд / FutureLearn): Хубав кратък курс за машинно обучение с фокус върху големи данни. Обхваща няколко инструмента като R, H2O Flow и WEKA. Само три седмици с препоръчителни два часа седмично, но един рецензент отбеляза, че шест часа седмично би било по-подходящо. Налични са безплатни и платени опции. Той има среднопретеглена оценка с 4 звезди над 4 отзива.

Геномни данни и клъстеринг на данни (Биоинформатика V) (Калифорнийския университет, Сан Диего / Курсара): За тези, които се интересуват от пресечната точка на компютърните науки и биологията и как тя представлява важна граница в съвременната наука. Фокусира се върху групирането и намаляването на размерите. Част от специализацията по биоинформатика на UCSD. Налични са безплатни и платени опции. Той има среднопретеглена оценка с 4 звезди над 3 отзива.

Въведение в машинното обучение (Udacity): Приоритизира широчината на темите и практическите инструменти (в Python) над дълбочината и теорията. Инструкторите, Себастиан Трън и Кейти Малоун, правят този клас толкова забавен. Състои се от видеоклипове и виктори с размер на хапки, последвани от мини-проект за всеки урок. Понастоящем част от анализатора на данни Udacity Nanodegree. Прогнозна времева линия от десет седмици. Безплатно. Той има среднопретеглена оценка от 3,95 звезди над 19 отзива.

Машинно обучение за анализ на данни (Wesleyan University / Coursera): Кратко интро машинно обучение и няколко избрани алгоритми. Обхваща дървета с решения, случайни гори, регресия на ласо и к-групиране. Част от специализацията за анализ и интерпретация на данни на Уеслиан. Прогнозна времева линия от четири седмици. Налични са безплатни и платени опции. Той има среднопретеглена 3,6-звездна оценка над 5 отзива.

Програмиране с Python for Data Science (Microsoft / edX): Произведено от Microsoft в партньорство с Coding Dojo. Използва Python. Осем часа седмично над шест седмици. Налични са безплатни и платени опции. Той има 3.46-звездна средно претеглена оценка над 37 отзива.

Машинно обучение за търговия (Georgia Tech / Udacity): Фокусира се върху прилагането на вероятностни подходи за машинно обучение при търговски решения. Използва Python. Част от инженерът за машинно обучение на Udacity Nanodegree и онлайн магистърската степен на OMS на Georgia Tech. Прогнозна времева линия от четири месеца. Безплатно. Той има среднопретеглена оценка от 3,29 звезди над 14 отзива.

Практическо машинно обучение (Университет на Джон Хопкинс / Coursera): Кратко, практическо запознаване с редица алгоритми за машинно обучение. Няколко отзива за една / две звезди, изразяващи най-различни притеснения. Част от специализацията на научните данни на JHU. Четири до девет часа седмично в продължение на четири седмици. Налични са безплатни и платени опции. Той има среднопретеглена 3,1-звездна оценка над 37 отзива.

Машинно обучение за наука и анализи на данни (Columbia University / edX): Въвежда широка гама от теми за машинно обучение. Някои страстни отрицателни отзиви с опасения, включително избор на съдържание, липса на задания за програмиране и не вдъхновяващо представяне. Седем до десет часа седмично през пет седмици. Безплатен с проверен сертификат за закупуване. Той има среднопретеглена оценка от 2,74 звезди над 36 отзива.

Специализация на препоръчителните системи (Университет на Минесота / Курса): Силен фокус върху един специфичен тип машинно обучение - системи за препоръки. Специализация в четири курса плюс проект на основен камък, който е казус. Преподавано с използване на LensKit (отворен код на инструментариум за препоръчителни системи). Налични са безплатни и платени опции. Той има среднопретеглена оценка с 2 звезди над 2 отзива.

Машинно обучение с големи данни (Калифорнийски университет, Сан Диего / Курсара): Ужасни отзиви, които подчертават лошата инструкция и оценка. Някои отбелязаха, че са им необходими само часове, за да завършат целия курс. Част от голямата специализация на UCSD. Налични са безплатни и платени опции. Той има среднопретеглена оценка от 1.86 звезди над 14 отзива.

Практически аналитични прогнози: Модели и методи (Университет във Вашингтон / Coursera): Кратко представяне на основните концепции за машинно обучение. Един рецензент отбеляза, че има липса на тестове и че задачите не са предизвикателни. Част от науката за данни на UW в специализирана скала. Шест до осем часа седмично в продължение на четири седмици. Налични са безплатни и платени опции. Има среднопретеглена оценка от 1,75 звезди над 4 отзива.

Следващите курсове имаха един или никакъв преглед към май 2017 г.

Машинно обучение за музиканти и художници (Голдсмитс, Лондонски университет / Каденце): Уникален. Студентите учат алгоритми, софтуерни инструменти и най-добри практики за машинно обучение, за да осмислят човешки жест, музикално аудио и други данни в реално време. Седем сесии по дължина. Налични са опции за одит (безплатни) и премии (10 USD на месец). Има един 5-звезден преглед.

Приложно машинно обучение в Python (University of Michigan / Coursera): Преподава се с използване на Python и инструментариума за научаване на scikit. Част от Приложната наука за данни с специализация на Python. Планирано да започне на 29 май. Налични са безплатни и платени опции.

Приложно машинно обучение (Microsoft / edX): Преподава се с използване на различни инструменти, включително Python, R и Microsoft Azure Machine Learning (забележка: Microsoft произвежда курса). Включва практически лаборатории за подсилване на лекционното съдържание. Три до четири часа седмично в продължение на шест седмици. Безплатен с проверен сертификат за закупуване.

Машинно обучение с Python (Университет за големи данни): Преподава се с използване на Python. Насочена към начинаещи. Приблизително време за завършване от четири часа. Университетът за големи данни е свързан с IBM. Безплатно.

Машинно обучение с Apache SystemML (Университет за големи данни): Преподава се с използване на Apache SystemML, който е език на декларативен стил, предназначен за широкомащабно машинно обучение. Приблизително време за завършване от осем часа. Университетът за големи данни е свързан с IBM. Безплатно.

Машинно обучение за наука за данни (Университет в Калифорния, Сан Диего / edX): Стартира до януари 2018 г. Примерите за програмиране и заданията са в Python, като се използват тетрадки от Юпитер. Осем часа на седмица над десет седмици. Безплатен с проверен сертификат за закупуване.

Въведение в аналитичното моделиране (Georgia Tech / edX): Курсът рекламира R като основен инструмент за програмиране. Пет до десет часа на седмица над десет седмици. Безплатен с проверен сертификат за закупуване.

Прогнозна аналитика: получаване на статистически данни от големи данни (Куинсландския технологичен университет / FutureLearn): Кратък преглед на няколко алгоритма. Използва платформата Vertica Analytics на Hewlett Packard Enterprise като приложен инструмент. Начална дата, която трябва да бъде обявена. Два часа седмично в продължение на четири седмици. Безплатен със сертификат за постижения на разположение за закупуване.

Въвеждане на машинно обучение (Universitas Telefónica / Miríada X): Преподава се на испански език. Въведение в машинното обучение, което обхваща обучението под надзор и без надзор. Общо двадесет прогнозни часа за четири седмици.

Стъпка на машинното обучение (Dataquest): Преподава се в Python, използвайки интерактивната платформа в браузъра на Dataquest. Множество ръководени проекти и „плюс“ проект, при който изграждате своя собствена система за машинно обучение, използвайки собствените си данни. Изисква се абонамент.

Следните шест курса се предлагат от DataCamp. Хибридният стил на преподаване на DataCamp използва видео и текстова инструкция с много примери чрез редактор на код в браузъра. За пълен достъп до всеки курс е необходим абонамент.

DataCamp предлага няколко курса за машинно обучение.

Въведение в машинното обучение (DataCamp): Алгоритми за класификация, регресия и клъстериране. Използва R. Петнадесет видеоклипа и 81 упражнения с приблизителна времева граница от шест часа.

Надзорно обучение с scikit-learn (DataCamp): Използва Python и scikit-learn. Покрива алгоритмите за класификация и регресия. Седемнайсет видеоклипа и 54 упражнения с прогнозна времева линия от четири часа.

Неподдържано обучение в R (DataCamp): Предоставя основно въведение в групирането и намаляването на размерите в R. Шестнадесет видеоклипа и 49 упражнения с прогнозна времева линия от четири часа.

Машинно кутия с инструменти за обучение (DataCamp): Учи на „големите идеи“ в машинното обучение. Използва R. 24 видеоклипа и 88 упражнения с прогнозна времева линия от четири часа.

Машинно обучение с експертите: училищни бюджети (DataCamp): казус от състезание по машинно обучение по DrivenData. Включва изграждането на модел за автоматично класифициране на елементи в бюджета на училището. „Надзорното обучение с наука за наука“ на DataCamp е задължително условие. Петнадесет видеоклипа и 51 упражнения с прогнозна времева линия от четири часа.

Ненадзорно обучение в Python (DataCamp): Обхваща различни алгоритми за непрекъснато обучение, използвайки Python, scikit-learn и scipy. Курсът завършва със студентите, изграждащи препоръчителна система за препоръчване на популярни музикални изпълнители. Тринадесет видеоклипа и 52 упражнения с прогнозна времева линия от четири часа.

Машинно обучение (Университет Том Мичъл / Карнеги Мелън): завършил уводен курс за машинно обучение на Карнеги Мелън. Необходимо условие за втория им курс на завършил курс, „Статистическо машинно обучение.“ Лепирани университетски лекции с проблеми от практиката, домашни задачи и среден срок (всички с решения), публикувани онлайн. Съществува и версия за курса от 2011 г. CMU е едно от най-добрите висши училища за изучаване на машинно обучение и има цял отдел, посветен на ML. Безплатно.

Статистическо машинно обучение (Университет Лари Васерман / Карнеги Мелън): Вероятно най-напредналият курс в това ръководство. Проследяване на курса за машинно обучение на Карнеги Мелън. Университетски лекции с проблеми с практиката, домашни задачи и среден срок (всички с решения), публикувани в интернет. Безплатно.

CMU е една от най-добрите училища в града за изучаване на машинно обучение. Машинното обучение и статистическото машинно обучение са достъпни онлайн безплатно.

Бакалавърско машинно обучение (Nando de Freitas / University of British Columbia): Бакалавърски курс за машинно обучение. Лекциите се снимат и пускат в YouTube с слайдовете, публикувани на уебсайта на курса. Курсовите задачи също са публикувани (все пак няма решения). дьо Фрейтас вече е редовен професор в Оксфордския университет и получава похвали за своите преподавателски способности в различни форуми. Налична версия на дипломиран (виж по-долу).

Машинно обучение (Nando de Freitas / University of British Columbia): Завършил курс за машинно обучение. Коментарите в бакалавърския курс на Де Фрейтас (по-горе) се прилагат и тук.

Опаковане

Това е петата серия от шест части, която обхваща най-добрите онлайн курсове за стартиране в областта на научните данни. Ние покрихме програмирането в първата статия, статистиката и вероятността във втората статия, въвеждането на науката за данните в третата статия и визуализацията на данните в четвъртата.

Последната част ще бъде резюме на тези статии, плюс най-добрите онлайн курсове за други ключови теми като борба с данни, бази данни и дори софтуерно инженерство.

Ако търсите пълен списък с онлайн курсове за наука за данни, можете да ги намерите на тематичната страница на „Наука за данни и големи данни“ на Class Central.

Ако ви хареса да четете това, разгледайте някои от другите парчета от Class Central:

Ако имате предложения за курсове, които пропуснах, уведомете ме в отговорите!

Ако сте намерили това полезно, щракнете върху , така че повече хора ще го видят тук на Medium.

Това е съкратена версия на оригиналната ми статия, публикувана в Class Central, където включих подробна програма за курсове.