Проучване на рамки за данни; R за възпроизводим научен анализ
Пътна карта
ВъпросиКак мога да манипулирам рамка с данни?

Умейте да добавяте и премахвате редове и колони.
Да можете да премахвате редове със стойности на NA .
Да можете да добавите два кадъра с данни.
Умейте да формулирате какво е фактор и как да конвертирате между фактор и характер .
Да можете да разберете основните свойства на рамка с данни, включително размер, клас или тип колони, имена и първи редове.
Досега сте виждали основните типове R данни и структури и всичко, което правите, ще бъде манипулация на тези инструменти. Сега ще научим нещо или две относно работата с класа на рамката с данни (структурата на данните, която ще използвате през повечето време и която ще бъде звездата на шоуто). Рамката с данни е таблицата, която създаваме при зареждане на информация от csv файл.
Ключови думи
Команда: Превод
nrow: брой редове
ncol: брой колони
rbind: комбиниране на редове
cbind: комбиниране на колони
Добавяне на колони и редове към рамка с данни
Научихме, че колоните в рамка с данни са вектори. Следователно знаем, че нашите данни са в съответствие с типа данни в тази колона. Ако искаме да добавим нова колона, можем да започнем, като създадем нов вектор:
След това можем да го добавим като колона чрез:
Имайте предвид, че той ще се провали, ако се опитаме да добавим вектор с различен брой входове, отколкото броят на редовете в рамката за данни.
Защото не съм работил? Разбира се, R иска да види елемент в новата ни колона за всеки ред в таблицата:
За да работи, трябва да имаме nrow (котки) = дължина (възраст). Ще заменим съдържанието на котките с новата ни рамка за данни.
Сега, какво ще кажете за добавяне на редове, в този случай, за последен път видяхме, че редовете на рамка с данни са съставени от списъци:
Какво означава грешката, дадена от R? „Невалидно ниво на фактор“ ни казва нещо за факторите ... но какво е фактор? Факторът е тип данни в R. Фактор е категория (например цвят), с която R може да извършва определени операции. Например:
Редът на факторите също може да се пренареди.
Фактори
Обектите от факторния клас са друг тип данни, които трябва да използваме внимателно. Когато R създава фактор, той позволява само стойностите, които първоначално са били там, когато сме заредили данните. Например в нашия случай „черен“, „канела“ и „тигро“. Всяка нова категория, която не се вписва в тези категории, ще бъде отхвърлена (и ще стане NA).
Предупреждението (Warning) ни казва да добавим „костенурка“ към нашия цветен фактор. Но останалите стойности, 3.3 (от тип числови), ИСТИНА (от тип логически) и 9 (от тип числови) бяха успешно добавени към теглото, като___низа и съответно възрастта, тъй като тези стойности не са от тип фактор. За да добавим нова категория „костенурка“ към рамката с данни за котки в цветната колона, трябва изрично да добавим „костенурка“ като ново ниво (ниво) във фактора:
Като алтернатива можем да променим колоната на тип символ. В този случай губим категориите, но отсега нататък можем да добавим всяка дума в колоната, без проблеми с нивата на фактора.
Предизвикателство 1
Нека си представим, че подобно на кучетата, 1 човешка година е еквивалентна на 7 години при котките (компанията Purina използва по-сложен алгоритъм).
- Създайте вектор с име human.age, като умножите котките $ възраст по 7.
- Преобразуване на човешката възраст във фактор.
- Преобразувайте човешката възраст обратно в числов вектор, като използвате функцията as.numeric (). Сега разделете на 7, за да се върнете към първоначалните епохи. Обяснете какво се е случило.