Pandas е Python библиотека с отворен код, използвана главно за манипулиране и анализ на данни. Той е изграден върху библиотеката NumPy и предоставя високопроизводителни, лесни за използване структури от данни и инструменти за анализ на данни за езика за програмиране Python.
В тази статия ще научите как да извършвате 6 основни операции с Pandas.
Използване на примери за панди
Можете да стартирате примерите в тази статия, като използвате изчислителни тетрадки като Тетрадка Jupyter, Google Colab, и т.н. Можете също да стартирате примерите, като въведете кода директно в интерпретатора на Python в интерактивен режим.
Ако искате да разгледате пълния изходен код, използван в тази статия, можете да получите достъп до файла на Python Notebook от това GitHub хранилище.
1. Как да импортирате Pandas като pd и да отпечатате номера на версията
Трябва да използвате внос ключова дума за импортиране на всяка библиотека в Python. Pandas обикновено се внася под pd псевдоним. С този подход можете да се отнасяте към пакета Pandas като pd вместо панди.
импортирайте панди като pd
печат (pd.__version__)
Изход:
1.2.4
2. Как да създадете серия в Pandas
Pandas Series е едномерен масив, който съхранява данни от всякакъв тип. Това е като колона в таблица. Можете да създадете серия, използвайки numpy масиви, numpy функции, списъци, речници, скаларни стойности и т.н.
Стойностите на серията са обозначени с техния индекс. По подразбиране първата стойност има индекс 0, втората стойност има индекс 1 и т.н. За да наименувате собствените си етикети, трябва да използвате индекс аргумент.
Как да създадете празна серия
s = pd. Серия (dtype='float64')
с
Изход:
Серия([], dtype: float64)
В горния пример празна серия с плува е създаден тип данни.
Как да създадете серия с помощта на масив NumPy
импортирайте панди като pd
импортирайте numpy като np
d = np.масив([1, 2, 3, 4, 5])
s = pd. Серия (d)
с
Изход:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Свързани: NumPy операции за начинаещи
Как да създадете серия с помощта на списък
d = [1, 2, 3, 4, 5]
s = pd. Серия (d)
с
Изход:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Как да създадете серия с индекс
За да създадете серия с индекс, трябва да използвате индекс аргумент. Броят на индексите трябва да е равен на броя на елементите в серията.
d = [1, 2, 3, 4, 5]
s = pd. Серия (d, индекс=["едно", "две", "три", "четири", "пет"])
с
Изход:
един 1
две 2
три 3
четири 4
пет 5
dtype: int64
Как да създадете серия с помощта на речник
Ключовете на речника стават етикетите на поредицата.
d = {"едно": 1,
"две": 2,
"три": 3,
"четири": 4,
"пет": 5}
s = pd. Серия (d)
с
Изход:
един 1
две 2
три 3
четири 4
пет 5
dtype: int64
Как да създадете серия с помощта на скаларна стойност
Ако искате да създадете серия, използвайки скаларна стойност, трябва да предоставите индекс аргумент.
s = pd. Серия (1, индекс = ["a", "b", "c", "d"])
с
Изход:
а 1
б 1
в 1
г 1
dtype: int64
3. Как да създадете рамка с данни в Pandas
DataFrame е двуизмерна структура от данни, в която данните са подравнени под формата на редове и колони. DataFrame може да бъде създаден с помощта на речници, списъци, списък с речници, numpy масиви и др. В реалния свят DataFrames се създават с помощта на съществуващо хранилище като CSV файлове, excel файлове, SQL бази данни и т.н.
Обектът DataFrame поддържа редица атрибути и методи. Ако искате да научите повече за тях, можете да разгледате официалната документация на рамка с данни на pandas.
Как да създадете празен DataFrame
df = pd. DataFrame()
печат (df)
Изход:
Празен DataFrame
Колони: []
Индекс: []
Как да създадете DataFrame с помощта на списък
listObj = ["MUO", "технология", "опростено"]
df = pd. DataFrame (listObj)
печат (df)
Изход:
0
0 MUO
1 технология
2 опростен
Как да създадете DataFrame с помощта на речник на ndarray/Lists
batmanData = {'Име на филма': ['Батман започва', 'Тъмният рицар', 'Тъмният рицар се издига'],
„Година на издаване“: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
печат (df)
Изход:
Име на филма Година на издаване
0 Батман започва 2005 г
1 Тъмният рицар 2008
2 Тъмният рицар се издига 2012
Как да създадете DataFrame с помощта на списък със списъци
данни = [['Алекс', 601], ['Боб', 602], ['Каталин', 603]]
df = pd. DataFrame (данни, колони = ['Име', 'Roll No.'])
печат (df)
Изход:
Име Рол №
0 Алекс 601
1 Боб 602
2 Каталина 603
Как да създадете DataFrame с помощта на списък с речници
data = [{'Име': 'Алекс', 'Номер на ролката': 601},
{'Име': 'Bob', 'Roll No.': 602},
{'Име': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (данни)
печат (df)
Изход:
Име Рол №
0 Алекс 601
1 Боб 602
2 Каталина 603
Свързани: Как да конвертирате списък в речник в Python
Как да създадете DataFrame с помощта на функция zip().
Използвай zip() функция за обединяване на списъци в Python.
Име = ['Алекс', 'Боб', 'Каталин']
RollNo = [601, 602, 603]
listOfTuples = списък (zip (име, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Име', 'Roll No.'])
печат (df)
Изход:
Име Рол №
0 Алекс 601
1 Боб 602
2 Каталина 603
4. Как да четете CSV данни в Pandas
Файлът "стойности, разделени със запетая" (CSV) е текстов файл с разделители, който използва запетая за разделяне на стойностите. Можете да прочетете CSV файл с помощта на read_csv() метод в панди. Ако искате да отпечатате целия DataFrame, използвайте to_string() метод.
В този и следващите примери, това CSV файл ще се използва за извършване на операциите.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.to_string())
Изход:
5. Как да анализирате DataFrames с помощта на методите head(), tail() и info().
Как да преглеждате данни с помощта на метода head().
В глава() Методът е един от най-добрите начини да получите бърз преглед на DataFrame. Този метод връща заглавката и посочения брой редове, започвайки от върха.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.head (10))
Изход:
Ако не посочите броя на редовете, ще бъдат върнати първите 5 реда.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.head())
Изход:
Как да преглеждате данни с помощта на метода tail().
В опашка () метод връща заглавката и посочения брой редове, като се започне от дъното.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.tail (10))
Изход:
Ако не посочите броя на редовете, ще бъдат върнати последните 5 реда.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.tail())
Изход:
Как да получите информация за данните
В информация() методите връщат кратко обобщение на DataFrame, включително индекса dtype и колона dtypes, стойности, различни от нула, и използване на паметта.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печат (df.info())
Изход:
6. Как да четете JSON данни в Pandas
JSON (ДжavaСкрипта Ообект нotation) е лек формат за обмен на данни. Можете да прочетете JSON файл с помощта на read_json() метод в панди. Ако искате да отпечатате целия DataFrame, използвайте to_string() метод.
В примера по-долу това JSON файл се използва за извършване на операциите.
Свързани: Какво е JSON? Обзор на лаика
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
печат (df.to_string())
Изход:
Освежете знанията си за Python с вградени функции и методи
Функциите помагат за съкращаване на вашия код и подобряване на неговата ефективност. Функции и методи като намали(), раздели(), изброявам(), eval(), кръгъл(), и т.н. може да направи кода ви здрав и лесен за разбиране. Винаги е добре да знаете за вградените функции и методи, тъй като те могат да опростят задачите ви по програмиране до голяма степен.
Стандартната библиотека на Python съдържа много функции, които да ви помогнат при задачите ви по програмиране. Научете за най-полезните и създайте по-стабилен код.
Прочетете Следващото
- Програмиране
- Python
- Уеб разработка
- Програмиране
- Анализ на данни

Юврадж е студент по компютърни науки в Университета в Делхи, Индия. Той е страстен за Full Stack уеб разработка. Когато не пише, той изследва дълбочината на различните технологии.
Абонирайте се за нашия бюлетин
Присъединете се към нашия бюлетин за технически съвети, ревюта, безплатни електронни книги и ексклузивни оферти!
Щракнете тук, за да се абонирате