Машинното обучение знае какво е и разликите между неговите видове

The машинно обучение или машинното обучение основно се състои от автоматизиране, използване на различни алгоритми, идентифициране на модели или тенденции, които са „скрити“ в данните. Поради тази причина е много важно не само да изберете най-подходящия алгоритъм (и последващата му параметризация за всеки конкретен проблем), но и да имате голям обем данни с достатъчно качество.

През последните години машинно обучение стана много важно в света на бизнеса, тъй като интелигентното използване на анализа на данни е от ключово значение за успеха на бизнеса. Прогнозите на Gartner за 2020 г. разкриват, че в допълнение към предимствата в области като интелигентно вземане на решения, роботика, автономни превозни средства и хипер-автоматизация, областта на сигурността се появява с голяма сила. По-специално приложения за изкуствен интелект за защита на свързани с IoT системи.

В този пост ще обясним от какво се състои машинното обучение, какви видове обучение има, как работят и за какво се използват.

Наистина, какво е машинно обучение?

Това е клон на изкуствения интелект, който започва да придобива значение от 80-те години. Това е вид AI, който вече не зависи от правила и програмист, но компютърът може да установи свои собствени правила и да научи сам по себе си същото.

Машинното обучение се осъществява чрез алгоритми. Алгоритъмът не е нищо повече от поредица от подредени стъпки, предприети за изпълнение на задача.

Целта на машинно обучение е да се създаде модел което ни позволява да решим дадена задача. Тогава знам влак моделът, използващ големи количества данни. Моделът научете се от тези данни и е в състояние да направи прогнози. В зависимост от задачата, която искате да изпълните, ще бъде по-подходящо да работите с един или друг алгоритъм.

Изборът на алгоритъма не е лесен. Ако търсим информация в интернет, можем да намерим истинска лавина от много подробни статии, които понякога, вместо да ни помагат, ни объркват. Затова ще се опитаме да дадем някои основни насоки, за да започнем да работим.

Има два основни въпроса, които трябва да си зададем. Първият е:

Какво искаме да направим?

Фактът е в това ясно дефинирайте целта. За да решим проблема си, тогава ще се запитаме какъв вид задача ще трябва да предприемем. Може да бъде, например, на:

Проблеми с класификацията като откриване на нежелана поща или нежелана поща.
Проблеми с клъстериране като препоръчване на книга на потребител въз основа на предишните им покупки (система за препоръки) f
Проблеми с регресията, като да разберем колко определен клиент ще използва услуга (определяне на стойност)

Ако разгледаме класическия проблем на задържане на клиент, Виждаме, че можем да го подходим от различни подходи. Искаме да направим сегментиране на клиенти, да, но коя стратегия е най-подходяща? По-добре ли е да се третира като проблем с класификация, групиране или дори регресия? Ключовата улика ще бъде дадена, като си зададем втория въпрос.

Каква информация имам, за да постигна целта си?

Ако се запитам: „Моите клиенти, те групирани ли са по някакъв начин, естествено?“, Не съм определил никаква цел (цел) за групиране.

Ако обаче задам въпроса по този начин: Можем ли да идентифицираме групи клиенти с голяма вероятност да поискат прекратяване на услугата веднага след приключване на договора им? цел перфектно дефиниран: ще се откаже ли клиентът? и ние искаме да предприемем действия в зависимост от отговора, който получаваме.

В първия случай се сблъскваме с пример за учене без надзор, докато вторият е от контролирано обучение.

В началните фази на процеса на Data Science е много важно да се реши дали „стратегията за атака“ ще бъде контролирана или без надзор, а в последния случай да се определи точно каква ще бъде стратегията за атака. целева променлива. Както решим, ще работим с едно семейство алгоритми или с друго.