Как да анализирате данни Ръководството стъпка по стъпка за използване на вашите данни

Да видим дали ви звучи познато: „Не знам как да анализирам данни ... и се страхувам, че защото не познавам статистически данни и още по-малко как да ги прилагам“

Чували ли сте някога за статистика? Или дори сте изучавали предмет в университета. Сега е моментът да го приложите ... и дори не знаете откъде да започнете.

Със сигурност в момента имате въпрос, който ви тревожи:

¿Какъв статистически метод прилагам? да анализирам данни от моя проект?

С други думи

¿Как мога да анализирам данните си ефективно?

Съвсем нормално е да се притеснявате. Приложната статистика е жив инструмент това отнема практика и фокус.

Днес искам да ви покажа глобална и практическа визия за процеса на анализ на данни и как да намерим фокуса, необходим за анализ на данни като професионалист.

Съдържание

# Кой метод е най-подходящ за анализ на данните от моя проект?

Както ти казвах. Непознаването на коя техника да се приложи или как да се използва приложената статистика е много повтарящо се безпокойство.

Приложна статистика е дисциплина с много техники и концепции. И мога да си представя бъркотията, която имате в момента в главата си.

В този пост ще атакувам директно тази грижа, която ви тревожи.

За да се реши, е необходимо да се разгледат 4 много важни аспекта.

¿Какви са етапите на цялостен процес на анализ на данни?

¿Какво представлява таблицата с данни и как се подрежда? (The Променливи)

¿Как мога да тълкувам данните? (The Проучване)

¿Каква статистическа техника прилагам във всеки отделен случай? (The Анализ)

¿Какъв софтуер използвам и как да се науча да го използвам??

Сега ще ви покажа следните важни аспекти:

Какви са етапите на процеса на анализ на данните?

От съществено значение е да имате глобална снимка на процеса на анализ на данни. Можете да се изгубите в количеството статистически техники и стратегии, с които разполагате.

Да бъдете съсредоточени е от ключово значение за вашия успех. След това ви представям 6-те етапа, които съставляват цялостен процес на анализ на данните:

  1. Проблемът . Всичко се ражда от проблем, от реална нужда. На този етап ще определите фокуса и целта на проекта. „Как да анализираме данните“ зависи от тази отправна точка. Най-важните.
  2. Споменът . Това е проектирането на метод за получаване на ДАННИ. По-технически това е процес на експериментиране. Това може да бъде проучване, тестове в лаборатории, с пациенти, подхранване с маркетингови данни в социалните мрежи и т.н. ... За добри изходни данни е важно да дефинирате таблицата с данни по-рано.
  3. Почистване Хомогенизирайте данните по отношение на формата, отменете наблюденията, които не ви интересуват и съхранявайте най-полезните. Изградете нови променливи от съществуващите. Влизам в други действия.
  4. Проучване . Използвайки описателна статистика, ще можете да преобразувате ДАННИТЕ в графики и характеристики, които можете да интерпретирате. Този етап на изследване е синоним на откритие. За да "говорите" с данните.
  5. Анализът . С помощта на инференциална статистика ще намерите заключения на голям набор (популация) с информацията на малка част от този набор (извадка). Понякога може да имате данни за цялото население. Тестването на хипотези е най-известният инструмент за извод. Но има и други невероятни и мощни техники: корелация, статистически модели с причинно-следствена връзка, алгоритми за регресия и класификация. И техники като групиране, намаляване на размерите или правила за асоцииране. Сред други.
  6. Заключението Ще интерпретирате резултатите от анализа и ще изброите заключенията. Ще бъдете много по-близо до целта, която сте си поставили в началото. И разрешаването на първоначалния проблем.

В края на тази публикация ще разкрия тайната, която исках да ви кажа. И това е свързано с последните три етапа, които сега видяхте 🙂

Ще ви кажа как да анализирате данните, след като сте готови за работа с таблицата с данни.

Какво представлява таблицата с данни и как се подрежда?

Сега спирам. В етап 4 на проучване. В него започвате да работите с данни, които вече са чисти и организирани. Ще започнете да моделирате таблицата си с данни.

За да ме разберете, таблицата с данни е масив със своите клетки. Нещо такова:

вашите

  • The редове са наблюдения. Наблюденията са времето, което измервате. Наблюденията могат да бъдат: пациенти, растения, животни, индивиди, събития, дни и т.н.
  • The колони са променливи. Променливите са характеристиките, които ще измервате. И има два страхотни типа. Ще ви кажа по-долу.
  • The заглавна част са имена на променливи. Обикновено името е представено на първия ред.

Това изглежда глупаво е много важно. Разбирането, че вашата таблица с данни са колони с цифри или букви е изключително важно.

И класификацията на променливите също. The променливите са характеристиките, които ще измервате. И на практика ще срещнете 2 страхотни момчета.

  • Количествено . Има числа и те имат единици. Те имат усещане за мащаб. Те могат да бъдат дискретни (без десетични знаци) и непрекъснати (с десетични знаци). Например теглото в кг.
  • Качествен Има етикети или Имена от нещата. Страната на произход, семейното положение, пола и т.н. ... Те могат да бъдат номинални или редови.
  • Пореден (качествен) . Те са специален вид качествени с a имат a усещане за мащаб. Например: качеството на услугата може да бъде справедливо, нормално, добро, много добро.