Как да анализирате данни Ръководството стъпка по стъпка за използване на вашите данни
Да видим дали ви звучи познато: „Не знам как да анализирам данни ... и се страхувам, че защото не познавам статистически данни и още по-малко как да ги прилагам“
Чували ли сте някога за статистика? Или дори сте изучавали предмет в университета. Сега е моментът да го приложите ... и дори не знаете откъде да започнете.
Със сигурност в момента имате въпрос, който ви тревожи:
¿Какъв статистически метод прилагам? да анализирам данни от моя проект?
С други думи
¿Как мога да анализирам данните си ефективно?
Съвсем нормално е да се притеснявате. Приложната статистика е жив инструмент това отнема практика и фокус.
Днес искам да ви покажа глобална и практическа визия за процеса на анализ на данни и как да намерим фокуса, необходим за анализ на данни като професионалист.
Съдържание
# Кой метод е най-подходящ за анализ на данните от моя проект?
Както ти казвах. Непознаването на коя техника да се приложи или как да се използва приложената статистика е много повтарящо се безпокойство.
Приложна статистика е дисциплина с много техники и концепции. И мога да си представя бъркотията, която имате в момента в главата си.
В този пост ще атакувам директно тази грижа, която ви тревожи.
За да се реши, е необходимо да се разгледат 4 много важни аспекта.
¿Какви са етапите на цялостен процес на анализ на данни?
¿Какво представлява таблицата с данни и как се подрежда? (The Променливи)
¿Как мога да тълкувам данните? (The Проучване)
¿Каква статистическа техника прилагам във всеки отделен случай? (The Анализ)
¿Какъв софтуер използвам и как да се науча да го използвам??
Сега ще ви покажа следните важни аспекти:
Какви са етапите на процеса на анализ на данните?
От съществено значение е да имате глобална снимка на процеса на анализ на данни. Можете да се изгубите в количеството статистически техники и стратегии, с които разполагате.
Да бъдете съсредоточени е от ключово значение за вашия успех. След това ви представям 6-те етапа, които съставляват цялостен процес на анализ на данните:
- Проблемът . Всичко се ражда от проблем, от реална нужда. На този етап ще определите фокуса и целта на проекта. „Как да анализираме данните“ зависи от тази отправна точка. Най-важните.
- Споменът . Това е проектирането на метод за получаване на ДАННИ. По-технически това е процес на експериментиране. Това може да бъде проучване, тестове в лаборатории, с пациенти, подхранване с маркетингови данни в социалните мрежи и т.н. ... За добри изходни данни е важно да дефинирате таблицата с данни по-рано.
- Почистване Хомогенизирайте данните по отношение на формата, отменете наблюденията, които не ви интересуват и съхранявайте най-полезните. Изградете нови променливи от съществуващите. Влизам в други действия.
- Проучване . Използвайки описателна статистика, ще можете да преобразувате ДАННИТЕ в графики и характеристики, които можете да интерпретирате. Този етап на изследване е синоним на откритие. За да "говорите" с данните.
- Анализът . С помощта на инференциална статистика ще намерите заключения на голям набор (популация) с информацията на малка част от този набор (извадка). Понякога може да имате данни за цялото население. Тестването на хипотези е най-известният инструмент за извод. Но има и други невероятни и мощни техники: корелация, статистически модели с причинно-следствена връзка, алгоритми за регресия и класификация. И техники като групиране, намаляване на размерите или правила за асоцииране. Сред други.
- Заключението Ще интерпретирате резултатите от анализа и ще изброите заключенията. Ще бъдете много по-близо до целта, която сте си поставили в началото. И разрешаването на първоначалния проблем.
В края на тази публикация ще разкрия тайната, която исках да ви кажа. И това е свързано с последните три етапа, които сега видяхте 🙂
Ще ви кажа как да анализирате данните, след като сте готови за работа с таблицата с данни.
Какво представлява таблицата с данни и как се подрежда?
Сега спирам. В етап 4 на проучване. В него започвате да работите с данни, които вече са чисти и организирани. Ще започнете да моделирате таблицата си с данни.
За да ме разберете, таблицата с данни е масив със своите клетки. Нещо такова:

- The редове са наблюдения. Наблюденията са времето, което измервате. Наблюденията могат да бъдат: пациенти, растения, животни, индивиди, събития, дни и т.н.
- The колони са променливи. Променливите са характеристиките, които ще измервате. И има два страхотни типа. Ще ви кажа по-долу.
- The заглавна част са имена на променливи. Обикновено името е представено на първия ред.
Това изглежда глупаво е много важно. Разбирането, че вашата таблица с данни са колони с цифри или букви е изключително важно.
И класификацията на променливите също. The променливите са характеристиките, които ще измервате. И на практика ще срещнете 2 страхотни момчета.
- Количествено . Има числа и те имат единици. Те имат усещане за мащаб. Те могат да бъдат дискретни (без десетични знаци) и непрекъснати (с десетични знаци). Например теглото в кг.
- Качествен Има етикети или Имена от нещата. Страната на произход, семейното положение, пола и т.н. ... Те могат да бъдат номинални или редови.
- Пореден (качествен) . Те са специален вид качествени с a имат a усещане за мащаб. Например: качеството на услугата може да бъде справедливо, нормално, добро, много добро.