Python за всеки 5 начина за генериране на произволни данни - Помислете за големи Empresas
В първата публикация на тази минисерия обяснихме защо трябва да генерираме произволни набори от данни, за да обучим нашите модели за машинно обучение. В днешната публикация ще видим 5 различни начина да го направим с Python.

Случайен модул
В модула случайни От стандартната библиотека на Python можем да намерим набор от функции, които позволяват получаване на случайни числа (за да бъдат строги, те всъщност са „псевдослучайни“), по различни начини.
За целта използва генератор на псевдослучайни числа (PRNG), известен като Mersenne Twister. Генерира произволно число от друго дадено число като входна или начална стойност. Става въпрос за a детерминиран генератор, тъй като от едно и също семе винаги се получава един и същ резултат.
В предишната публикация вече коментирахме, че тези псевдослучайни числа са напълно валидни за повечето от проблемите, които моделираме с помощта на алгоритми за машинно обучение. Те обаче не са полезни за работа в криптография и среда за сигурност. В тези случаи се използва модулът „тайни“, който позволява генерирането на наистина случайни числа (генератори на истински случайни числа (TRNG).
5 различни начина за генериране на произволни числа
- randint (): връща цяло число между посочените стойности. Долната и горната граници също могат да се появят между върнатите стойности. За десетични числа (float) се използва функцията uniform ()
- randrange (): връща цели числа между начална и крайна стойност, разделени със специфична стойност "стъпка"
- choice () и choices (), ви позволяват да избирате произволно стойности от списък. Те вземат списък като аргумент и произволно избират стойност (или стойности в случай на избор ()). Също така може да се приложи матрица с тегла, за да се увеличи вероятността да бъде избрана определена стойност.
- shuffle (): "разбърква" списък. Тази функция 'смесва' или произволно променя реда на елементите в списък, преди да избере един от тях
- gauss (): генерира набор от случайни числа, чието разпределение на вероятностите е Гаусово или нормално разпределение (много често в реалния свят). Има подобни функции за други различни дистрибуции.