โน๏ธ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.1 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | FAIL | meta_canonical IS NULL OR = '' OR = src_unparsed | net,wikidocs!/book/1 s443 |
| Property | Value |
|---|---|
| URL | https://wikidocs.net/86290 |
| Last Crawled | 2026-04-07 09:28:55 (2 days ago) |
| First Indexed | 2022-08-07 00:47:09 (3 years ago) |
| HTTP Status Code | 200 |
| Meta Title | 03. ๋ฐ์ดํฐ์๊ฐํ(seaborn) - ํ์ด์ฌ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต |
| Meta Description | ํ์ด์ฌ ๋ฐ์ดํฐ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค ํ๋์ธ [Seaborn](https://seaborn.pydata.org/index.html)์ ๋ํด์ ์ดํด๋ณด๊ฒ ์ต๋๋ค. ์ ์ข
๋ฅ๋ฅผ ์ ๋ฆฌํ ๋ด์ฉ์
๋๋ค.
๋ค์ํ ์ข
๋ฅ์ plot์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ์ฒ์์๋ ์ด๋ค ๊ทธ๋ํ๋ฅผ ๊ฐ์ ธ๋ค ์จ์ผํ ์ง ๋ง๋งํฉ๋๋ค. ๋ชจ๋ plot์ ์ฌ์ฉ๋ฒ์ ์์งํ ํ์๋ ์์ต๋๋ค. ๋ฐ์ดํฐ์ ์ข
๋ฅ๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ธ์ง, ์นดํ
๊ณ ๋ฆฌ ๋ฐ์ดํฐ์ธ์ง, ๋ด๊ฐ ๊ถ๊ธํ ๋ด์ฉ์ด ๋ฐ์ดํฐ์ ์๊ณ์ด์ ๋ณํ์ธ์ง ๋ถํฌ์ธ์ง์ ๋ฐ๋ผ ์ ํฉํ ๊ทธ๋ํ๋ฅผ ์ ํํด์ ๋์ํํ๋ ๋ฐฉ๋ฒ์ ์ตํ๋ค๋ฉด ์ถฉ๋ถํฉ๋๋ค.
์ด๋ฒ ์ฅ์์๋ Seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํ๋ plot์ ์ข
๋ฅ๋ฅผ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ๋ก ์ ๋ฆฌํด๋ณด๊ฒ ์ต๋๋ค.
๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
์ฐ์ seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๊ณ ๋ฐ์ดํฐ ํ๋ ์์ ๋ค๋ฃจ๊ธฐ ์ํด ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ๋ฅผ ํฉ๋๋ค.
#๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
import
pandas
as
pd
import
matplotlib.pyplot
as
plt
import
seaborn
as
sns
#seaborn์์ ์ ๊ณตํ๋ flights ๋ฐ์ดํฐ ์
์ ์ฌ์ฉ
flights = sns.load_dataset(
'flights'
)
#๊ทธ๋ํ ์ฌ์ด์ฆ ์ค์
plt.figure(figsize=(
12
,
3
))
Barplot
sns.barplot(
data
=flights, x=
"year"
, y=
"passengers"
)
๋ง๋๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ barplot์
๋๋ค. flights ๋ฐ์ดํฐ ํ๋ ์์ x ์ถ์๋ year ์ปฌ๋ผ์ ๊ฐ์, y ์ถ์๋ passengers ์ปฌ๋ผ์ ๊ฐ์ ๋์ํํฉ๋๋ค. x์ถ์ ์ฌ์ฉํ year๊ฐ์ ์ ์ํ ๋ฐ์ดํฐ๋ก barplot์ ๊ทธ๋ฆฌ๊ธฐ ์ ํฉํ ํํ์ ๋ฐ์ดํฐ์
๋๋ค. ๋ง์ฝ x์ถ์ผ๋ก ์ฌ์ฉํ ๊ฐ์ด ์์ซ์ ์ ํฌํจํ ์ค์ํ์ ์ฐ์๋ฐ์ดํฐ๋ผ๋ฉด barplot์ด ๊ต์ฅํ ์ธ๋ฐํ๊ฒ ํ์๋์ด ๊ทธ๋ํ๋ฅผ ์ดํดํ๊ธฐ ์ด๋ ค์ด ํํ๊ฐ ๋ ๊ฒ์
๋๋ค. barplot๊ณผ ๊ฐ์ด Categorical Plot์ ์ฌ์ฉํ ๋์๋ ์ค์ํ์
์ ์ฐ์ํ ๋ฐ์ดํฐ๊ฐ x์ถ์ ์ค์ ๋์ง ์๋๋ก ํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
barplot์ ๊ฐ๊ฐ์ ๊ฐ์ ๊ฒ์ ์ ๋ง๋๊ฐ ๊ฝํ ์๋ ๊ฒ์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ๋ํ๋
๋๋ค. barplot์ ๊ฐ๊ฐ์ x์ถ(์ฐ๋) ๊ฐ์ ๋ํด ํ๋์ ๋ํ๊ฐ์ y์ถ(์น๊ฐ ์)์ผ๋ก ์ค์ ํด์ผํ๋ฏ๋ก ๋ฐ์ดํฐ์ ํ๊ท ๊ฐ์ ์ฌ์ฉํ์ฌ ํ์ํ๊ฒ ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด 1949๋
์ ์น๊ฐ์๊ฐ 100๋ช
์ธ ๋ ๋ ์๊ณ , 120๋ช
์ธ ๋ ๋ ์์๋๋ฐ ํ๊ท ์ธ 110์ ๊ธฐ์ค์ผ๋ก ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ฒ ๋๋ ๊ฒ์
๋๋ค. ๋ฐ์ดํฐ์ 4๋ถ์์ ๊ธฐ์ค์ผ๋ก ์์ธํ ๋ถํฌ๋ฅผ ๋์ํํ๊ณ ์ถ๋ค๋ฉด violinplot์ด๋ swarmplot์ ์ฌ์ฉํ๋ ๊ฒ์ด ๋์ฑ ํจ๊ณผ์ ์
๋๋ค.
Boxplot
sns.boxplot(
data
=flights, x=
"year"
, y=
"passengers"
)
Violineplot
sns.violinplot(
data
=flights, x=
"year"
, y=
"passengers"
)
Swarmplot
sns.swarmplot(
data
=flights, x=
"year"
, y=
"passengers"
)
Boxplot, Violinplot, Swarmplot์ barplot๊ณผ ์ ์ฌํ๊ฒ x์ถ(์ฐ๋)๋ณ y์ถ(์น๊ฐ ์) ๊ฐ์ ํ์ํ์ง๋ง, ํ๋์ ๋ํ๊ฐ์ผ๋ก ํ์ํ๋ ๊ฒ์ด ์๋๋ผ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ธํ ์ ์๋๋ก ํ์ํฉ๋๋ค.
Lineplot
sns.lineplot(
data
=flights, x=
"year"
, y=
"passengers"
)
์ ๊ทธ๋ํ๋ฅผ ๋์ํํ lineplot์
๋๋ค. ์์์ ๊ทธ๋ฆฐ barplot๊ณผ ๋์ผํ x, y์ถ ๋ฐ์ดํฐ๋ฅผ ์ค์ ํ์์ต๋๋ค.
barplot์ ๊ฐ์ฅ ์์ ์ ์ ํ๋์ ์ ์ผ๋ก ์ด์ ํํ์ ๊ทธ๋ํ๊ฐ ๊ทธ๋ ค์ก์ต๋๋ค. ์ ์ฃผ๋ณ์ ์
์ ํ๋์์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ํ์ํ ๊ฒ์
๋๋ค .์ฆ 1950๋
์๋ y์ถ ๋ฐ์ดํฐ(์น๊ฐ์)๊ฐ ์ฝ 150๋ถ๊ทผ์ ๋๋ถ๋ถ ๋ชฐ๋ ค์์๋ค๋ฉด 1960๋
์๋ 400~500 ์ฌ์ด์ ๋ถํฌํ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
Distplot
displot์ ํ๋์ ๋ฐ์ดํฐ์ ๋ํด ๋ถํฌ๋ฅผ ํ์ธํ ๋ ์ฌ์ฉํฉ๋๋ค.
sns
.distplot
(flights
[
"passengers"
]
)
์น๊ฐ ๋ฐ์ดํฐ๋ 100~300 ์ฌ์ด์ ๋ง์ด ๋ถํฌํด์๋ค๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. displot์์๋ ๋ง๋(bin)๋ฅผ ์ฌ์ฉํ ํ์คํ ๊ทธ๋จ๊ณผ ๋ฐ๋๋ฅผ ์ ์ผ๋ก ์ด์ kde plot์ด ํจ๊ป ๊ทธ๋ ค์ง๋๋ค. ํ๋ผ๋ฏธํฐ ์ค์ ์ ํตํด ๋ง๋์ ๊ฐ์์ kde์ ํ์ ์ฌ๋ถ ๋ฑ์ ์ถ๊ฐ๋ก ์ค์ ํ ์ ์์ต๋๋ค. |
| Markdown | ๋ชฉ์ฐจ๋ณด๊ธฐ
Show
Hide
[**ํ์ด์ฌ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต**](https://wikidocs.net/book/4764)
[00\. ์๊ฐ]() [01\. ํ์ด์ฌ ๊ธฐ๋ณธ(list, dictionary, string ๋ฑ)]() [02\. ํ์ด์ฌ ์์ฉ(numpy, pandas)]() [03\. ๋ฐ์ดํฐ์๊ฐํ(seaborn)]() [04\. Kaggle]() [04-00. Kaggle ์ด๋?]() [04-00-01. Kaggle ํ์ผ ์ ์ถํ๊ธฐ]() [04-00-02. Kaggle - Colab ์ฐ๋๋ฐฉ๋ฒ]() [04-01. Titanic]() [04-01-01. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ์ค์ต]() [04-01-02. ๋ฐ์ดํฐ ์๊ฐํ ์ค์ต]() [04-01-03. ๋ชจ๋ธ ์์ฑ ์ค์ต]() [04-02. Bike Sharing Demand(์์ฑ์ค)]() [04-02-01. ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต(์์ฑ์ค)]() [04-03. San Francisco Crime Classification]() [04-03-01. ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต]() [04-03-02. ๋ฐ์ดํฐ์๊ฐํ ์ค์ต]() [04-03-03. ๋ชจ๋ธ ์์ฑ ์ค์ต(์ต์
)]() [04-04. Popcorn]() [04-04-01. ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต]() [04-04-02. ๋ฐ์ดํฐ์๊ฐํ ์ค์ต]() [04-04-03. ๋ชจ๋ธ ์์ฑ ์ค์ต]() [04-05. MNIST (DIGIT RECOGNIER)]() [04-05-01. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ]() [04-06. Dogs and Cats]() [04-06-01. ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต]() [04-06-02. ๋ฐ์ดํฐ์๊ฐํ ์ค์ต]() [04-06-03. ๋ชจ๋ธ ์์ฑ ์ค์ต]() [04-07. Dog Breed Identification]() [04-07-01. ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต]() [04-07-02. ๋ฐ์ดํฐ์๊ฐํ ์ค์ต]() [04-07-03. ๋ชจ๋ธ ์์ฑ ์ค์ต]() [04-08. ํธ์ํฐ ๋ถ์]() [04-08-01 ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต]() [04-08-02 ๋ฐ์ดํฐ์๊ฐํ ์ค์ต]() [04-08-03 ๋ชจ๋ธ ์์ฑ ์ค์ต]() [04-09. ์๋ฌผ ๋ชจ์ข
๋ถ๋ฅ]() [04-09-01. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ์ค์ต]() [04-09-02. ๋ฐ์ดํฐ ์๊ฐํ ์ค์ต]()
1. [**ํ์ด์ฌ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต**](https://wikidocs.net/book/4764)
2. [03\. ๋ฐ์ดํฐ์๊ฐํ(seaborn)](https://wikidocs.net/86290)
1. [์ํค๋
์ค](https://wikidocs.net/)
# 03\. ๋ฐ์ดํฐ์๊ฐํ(seaborn)
- [๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ](https://wikidocs.net/86290#_1)
- [Barplot](https://wikidocs.net/86290#barplot)
- [Boxplot](https://wikidocs.net/86290#boxplot)
- [Violineplot](https://wikidocs.net/86290#violineplot)
- [Swarmplot](https://wikidocs.net/86290#swarmplot)
- [Lineplot](https://wikidocs.net/86290#lineplot)
- [Distplot](https://wikidocs.net/86290#distplot)
ํ์ด์ฌ ๋ฐ์ดํฐ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค ํ๋์ธ [Seaborn](https://seaborn.pydata.org/index.html)์ ๋ํด์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.

ํ์ด์ฌ์ ๋ํ์ ์ธ ์๊ฐํ ๋๊ตฌ๋ก๋ [matplotlib](https://matplotlib.org/)๊ณผ seaborn์ด ์์ต๋๋ค. seaborn์ matplotlib ๋๋น ์์ฝ๊ฒ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ณ ๊ทธ๋ํ ์คํ์ผ ์ค์ ์ ํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค. ์ ๊ตํ๊ฒ ๊ทธ๋ํ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ๊ฑฐ๋ ๊ฐ ์ถ์ ๋ฒ๋ก ๊ฐ์ ์กฐ์ ํ ๋์๋ matplotlib์ ํจ๊ป ์ฌ์ฉํด์ผํ์ง๋ง, seaborn ์ฌ์ฉ๋ฒ์ ์ต์ํด์ง๋ค๋ฉด ํฐ ๋ฌธ์ ๊ฐ ๋์ง ์์ต๋๋ค.
์๋ ํ๋ Seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํด์ฃผ๋ ๊ทธ๋ํ(plot)์ ์ข
๋ฅ๋ฅผ ์ ๋ฆฌํ ๋ด์ฉ์
๋๋ค.

๋ค์ํ ์ข
๋ฅ์ plot์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ์ฒ์์๋ ์ด๋ค ๊ทธ๋ํ๋ฅผ ๊ฐ์ ธ๋ค ์จ์ผํ ์ง ๋ง๋งํฉ๋๋ค. ๋ชจ๋ plot์ ์ฌ์ฉ๋ฒ์ ์์งํ ํ์๋ ์์ต๋๋ค. ๋ฐ์ดํฐ์ ์ข
๋ฅ๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ธ์ง, ์นดํ
๊ณ ๋ฆฌ ๋ฐ์ดํฐ์ธ์ง, ๋ด๊ฐ ๊ถ๊ธํ ๋ด์ฉ์ด ๋ฐ์ดํฐ์ ์๊ณ์ด์ ๋ณํ์ธ์ง ๋ถํฌ์ธ์ง์ ๋ฐ๋ผ ์ ํฉํ ๊ทธ๋ํ๋ฅผ ์ ํํด์ ๋์ํํ๋ ๋ฐฉ๋ฒ์ ์ตํ๋ค๋ฉด ์ถฉ๋ถํฉ๋๋ค.
์ด๋ฒ ์ฅ์์๋ Seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํ๋ plot์ ์ข
๋ฅ๋ฅผ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ๋ก ์ ๋ฆฌํด๋ณด๊ฒ ์ต๋๋ค.
## ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
์ฐ์ seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๊ณ ๋ฐ์ดํฐ ํ๋ ์์ ๋ค๋ฃจ๊ธฐ ์ํด ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ๋ฅผ ํฉ๋๋ค.
```
Copy#๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
#seaborn์์ ์ ๊ณตํ๋ flights ๋ฐ์ดํฐ ์
์ ์ฌ์ฉ
flights = sns.load_dataset('flights')
#๊ทธ๋ํ ์ฌ์ด์ฆ ์ค์
plt.figure(figsize=(12, 3))
```
## Barplot
```
Copysns.barplot(data=flights, x="year", y="passengers")
```
๋ง๋๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ barplot์
๋๋ค. flights ๋ฐ์ดํฐ ํ๋ ์์ x ์ถ์๋ year ์ปฌ๋ผ์ ๊ฐ์, y ์ถ์๋ passengers ์ปฌ๋ผ์ ๊ฐ์ ๋์ํํฉ๋๋ค. x์ถ์ ์ฌ์ฉํ year๊ฐ์ ์ ์ํ ๋ฐ์ดํฐ๋ก barplot์ ๊ทธ๋ฆฌ๊ธฐ ์ ํฉํ ํํ์ ๋ฐ์ดํฐ์
๋๋ค. ๋ง์ฝ x์ถ์ผ๋ก ์ฌ์ฉํ ๊ฐ์ด ์์ซ์ ์ ํฌํจํ ์ค์ํ์ ์ฐ์๋ฐ์ดํฐ๋ผ๋ฉด barplot์ด ๊ต์ฅํ ์ธ๋ฐํ๊ฒ ํ์๋์ด ๊ทธ๋ํ๋ฅผ ์ดํดํ๊ธฐ ์ด๋ ค์ด ํํ๊ฐ ๋ ๊ฒ์
๋๋ค. barplot๊ณผ ๊ฐ์ด Categorical Plot์ ์ฌ์ฉํ ๋์๋ ์ค์ํ์
์ ์ฐ์ํ ๋ฐ์ดํฐ๊ฐ x์ถ์ ์ค์ ๋์ง ์๋๋ก ํ๋ ๊ฒ์ด ์ข์ต๋๋ค.

barplot์ ๊ฐ๊ฐ์ ๊ฐ์ ๊ฒ์ ์ ๋ง๋๊ฐ ๊ฝํ ์๋ ๊ฒ์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ๋ํ๋
๋๋ค. barplot์ ๊ฐ๊ฐ์ x์ถ(์ฐ๋) ๊ฐ์ ๋ํด ํ๋์ ๋ํ๊ฐ์ y์ถ(์น๊ฐ ์)์ผ๋ก ์ค์ ํด์ผํ๋ฏ๋ก ๋ฐ์ดํฐ์ ํ๊ท ๊ฐ์ ์ฌ์ฉํ์ฌ ํ์ํ๊ฒ ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด 1949๋
์ ์น๊ฐ์๊ฐ 100๋ช
์ธ ๋ ๋ ์๊ณ , 120๋ช
์ธ ๋ ๋ ์์๋๋ฐ ํ๊ท ์ธ 110์ ๊ธฐ์ค์ผ๋ก ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ฒ ๋๋ ๊ฒ์
๋๋ค. ๋ฐ์ดํฐ์ 4๋ถ์์ ๊ธฐ์ค์ผ๋ก ์์ธํ ๋ถํฌ๋ฅผ ๋์ํํ๊ณ ์ถ๋ค๋ฉด violinplot์ด๋ swarmplot์ ์ฌ์ฉํ๋ ๊ฒ์ด ๋์ฑ ํจ๊ณผ์ ์
๋๋ค.
## Boxplot
```
Copysns.boxplot(data=flights, x="year", y="passengers")
```

## Violineplot
```
Copysns.violinplot(data=flights, x="year", y="passengers")
```

## Swarmplot
```
Copysns.swarmplot(data=flights, x="year", y="passengers")
```
Boxplot, Violinplot, Swarmplot์ barplot๊ณผ ์ ์ฌํ๊ฒ x์ถ(์ฐ๋)๋ณ y์ถ(์น๊ฐ ์) ๊ฐ์ ํ์ํ์ง๋ง, ํ๋์ ๋ํ๊ฐ์ผ๋ก ํ์ํ๋ ๊ฒ์ด ์๋๋ผ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ธํ ์ ์๋๋ก ํ์ํฉ๋๋ค.

## Lineplot
```
Copysns.lineplot(data=flights, x="year", y="passengers")
```
์ ๊ทธ๋ํ๋ฅผ ๋์ํํ lineplot์
๋๋ค. ์์์ ๊ทธ๋ฆฐ barplot๊ณผ ๋์ผํ x, y์ถ ๋ฐ์ดํฐ๋ฅผ ์ค์ ํ์์ต๋๋ค.

barplot์ ๊ฐ์ฅ ์์ ์ ์ ํ๋์ ์ ์ผ๋ก ์ด์ ํํ์ ๊ทธ๋ํ๊ฐ ๊ทธ๋ ค์ก์ต๋๋ค. ์ ์ฃผ๋ณ์ ์
์ ํ๋์์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ํ์ํ ๊ฒ์
๋๋ค .์ฆ 1950๋
์๋ y์ถ ๋ฐ์ดํฐ(์น๊ฐ์)๊ฐ ์ฝ 150๋ถ๊ทผ์ ๋๋ถ๋ถ ๋ชฐ๋ ค์์๋ค๋ฉด 1960๋
์๋ 400~500 ์ฌ์ด์ ๋ถํฌํ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
## Distplot
displot์ ํ๋์ ๋ฐ์ดํฐ์ ๋ํด ๋ถํฌ๋ฅผ ํ์ธํ ๋ ์ฌ์ฉํฉ๋๋ค.
```
Copysns.distplot(flights["passengers"])
```

์น๊ฐ ๋ฐ์ดํฐ๋ 100~300 ์ฌ์ด์ ๋ง์ด ๋ถํฌํด์๋ค๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. displot์์๋ ๋ง๋(bin)๋ฅผ ์ฌ์ฉํ ํ์คํ ๊ทธ๋จ๊ณผ ๋ฐ๋๋ฅผ ์ ์ผ๋ก ์ด์ kde plot์ด ํจ๊ป ๊ทธ๋ ค์ง๋๋ค. ํ๋ผ๋ฏธํฐ ์ค์ ์ ํตํด ๋ง๋์ ๊ฐ์์ kde์ ํ์ ์ฌ๋ถ ๋ฑ์ ์ถ๊ฐ๋ก ์ค์ ํ ์ ์์ต๋๋ค.
๋ง์ง๋ง ํธ์ง์ผ์ : 2020๋
8์ 31์ผ 10:52 ์ค์
[๋๊ธ 0]() [ํผ๋๋ฐฑ](https://wikidocs.net/86290#myModal "ํผ๋๋ฐฑ์ ๋จ๊ฒจ์ฃผ์ธ์")
[โป ๋๊ธ ์์ฑ์ ๋ก๊ทธ์ธ์ด ํ์ํฉ๋๋ค.](https://wikidocs.net/loginForm) [(๋๋ ํผ๋๋ฐฑ์ ์ด์ฉํด ์ฃผ์ธ์.)](https://wikidocs.net/86290#myModal)
- **์ด์ ๊ธ** : [02\. ํ์ด์ฌ ์์ฉ(numpy, pandas)]()
- **๋ค์๊ธ** : [04\. Kaggle]()
ร
#### ์ฑ
๊ฐํผ
์ถ๊ฐ
๋ซ๊ธฐ
ร
### ์ด ํ์ด์ง์ ๋ํ ํผ๋๋ฐฑ์ ๋จ๊ฒจ์ฃผ์ธ์
Close
์ ์กํ๊ธฐ
ร
### ๋๊ธ์ ์ ๊ณ ํฉ๋๋ค.
Close
์ ์กํ๊ธฐ |
| Readable Markdown | ํ์ด์ฌ ๋ฐ์ดํฐ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค ํ๋์ธ [Seaborn](https://seaborn.pydata.org/index.html)์ ๋ํด์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.

ํ์ด์ฌ์ ๋ํ์ ์ธ ์๊ฐํ ๋๊ตฌ๋ก๋ [matplotlib](https://matplotlib.org/)๊ณผ seaborn์ด ์์ต๋๋ค. seaborn์ matplotlib ๋๋น ์์ฝ๊ฒ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ณ ๊ทธ๋ํ ์คํ์ผ ์ค์ ์ ํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค. ์ ๊ตํ๊ฒ ๊ทธ๋ํ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ๊ฑฐ๋ ๊ฐ ์ถ์ ๋ฒ๋ก ๊ฐ์ ์กฐ์ ํ ๋์๋ matplotlib์ ํจ๊ป ์ฌ์ฉํด์ผํ์ง๋ง, seaborn ์ฌ์ฉ๋ฒ์ ์ต์ํด์ง๋ค๋ฉด ํฐ ๋ฌธ์ ๊ฐ ๋์ง ์์ต๋๋ค.
์๋ ํ๋ Seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํด์ฃผ๋ ๊ทธ๋ํ(plot)์ ์ข
๋ฅ๋ฅผ ์ ๋ฆฌํ ๋ด์ฉ์
๋๋ค.

๋ค์ํ ์ข
๋ฅ์ plot์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ์ฒ์์๋ ์ด๋ค ๊ทธ๋ํ๋ฅผ ๊ฐ์ ธ๋ค ์จ์ผํ ์ง ๋ง๋งํฉ๋๋ค. ๋ชจ๋ plot์ ์ฌ์ฉ๋ฒ์ ์์งํ ํ์๋ ์์ต๋๋ค. ๋ฐ์ดํฐ์ ์ข
๋ฅ๊ฐ ์ฐ์ํ ๋ฐ์ดํฐ์ธ์ง, ์นดํ
๊ณ ๋ฆฌ ๋ฐ์ดํฐ์ธ์ง, ๋ด๊ฐ ๊ถ๊ธํ ๋ด์ฉ์ด ๋ฐ์ดํฐ์ ์๊ณ์ด์ ๋ณํ์ธ์ง ๋ถํฌ์ธ์ง์ ๋ฐ๋ผ ์ ํฉํ ๊ทธ๋ํ๋ฅผ ์ ํํด์ ๋์ํํ๋ ๋ฐฉ๋ฒ์ ์ตํ๋ค๋ฉด ์ถฉ๋ถํฉ๋๋ค.
์ด๋ฒ ์ฅ์์๋ Seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํ๋ plot์ ์ข
๋ฅ๋ฅผ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ๋ก ์ ๋ฆฌํด๋ณด๊ฒ ์ต๋๋ค.
## ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
์ฐ์ seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๊ณ ๋ฐ์ดํฐ ํ๋ ์์ ๋ค๋ฃจ๊ธฐ ์ํด ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ๋ฅผ ํฉ๋๋ค.
```
#๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
#seaborn์์ ์ ๊ณตํ๋ flights ๋ฐ์ดํฐ ์
์ ์ฌ์ฉ
flights = sns.load_dataset('flights')
#๊ทธ๋ํ ์ฌ์ด์ฆ ์ค์
plt.figure(figsize=(12, 3))
```
## Barplot
```
sns.barplot(data=flights, x="year", y="passengers")
```
๋ง๋๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ barplot์
๋๋ค. flights ๋ฐ์ดํฐ ํ๋ ์์ x ์ถ์๋ year ์ปฌ๋ผ์ ๊ฐ์, y ์ถ์๋ passengers ์ปฌ๋ผ์ ๊ฐ์ ๋์ํํฉ๋๋ค. x์ถ์ ์ฌ์ฉํ year๊ฐ์ ์ ์ํ ๋ฐ์ดํฐ๋ก barplot์ ๊ทธ๋ฆฌ๊ธฐ ์ ํฉํ ํํ์ ๋ฐ์ดํฐ์
๋๋ค. ๋ง์ฝ x์ถ์ผ๋ก ์ฌ์ฉํ ๊ฐ์ด ์์ซ์ ์ ํฌํจํ ์ค์ํ์ ์ฐ์๋ฐ์ดํฐ๋ผ๋ฉด barplot์ด ๊ต์ฅํ ์ธ๋ฐํ๊ฒ ํ์๋์ด ๊ทธ๋ํ๋ฅผ ์ดํดํ๊ธฐ ์ด๋ ค์ด ํํ๊ฐ ๋ ๊ฒ์
๋๋ค. barplot๊ณผ ๊ฐ์ด Categorical Plot์ ์ฌ์ฉํ ๋์๋ ์ค์ํ์
์ ์ฐ์ํ ๋ฐ์ดํฐ๊ฐ x์ถ์ ์ค์ ๋์ง ์๋๋ก ํ๋ ๊ฒ์ด ์ข์ต๋๋ค.

barplot์ ๊ฐ๊ฐ์ ๊ฐ์ ๊ฒ์ ์ ๋ง๋๊ฐ ๊ฝํ ์๋ ๊ฒ์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ๋ํ๋
๋๋ค. barplot์ ๊ฐ๊ฐ์ x์ถ(์ฐ๋) ๊ฐ์ ๋ํด ํ๋์ ๋ํ๊ฐ์ y์ถ(์น๊ฐ ์)์ผ๋ก ์ค์ ํด์ผํ๋ฏ๋ก ๋ฐ์ดํฐ์ ํ๊ท ๊ฐ์ ์ฌ์ฉํ์ฌ ํ์ํ๊ฒ ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด 1949๋
์ ์น๊ฐ์๊ฐ 100๋ช
์ธ ๋ ๋ ์๊ณ , 120๋ช
์ธ ๋ ๋ ์์๋๋ฐ ํ๊ท ์ธ 110์ ๊ธฐ์ค์ผ๋ก ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๊ฒ ๋๋ ๊ฒ์
๋๋ค. ๋ฐ์ดํฐ์ 4๋ถ์์ ๊ธฐ์ค์ผ๋ก ์์ธํ ๋ถํฌ๋ฅผ ๋์ํํ๊ณ ์ถ๋ค๋ฉด violinplot์ด๋ swarmplot์ ์ฌ์ฉํ๋ ๊ฒ์ด ๋์ฑ ํจ๊ณผ์ ์
๋๋ค.
## Boxplot
```
sns.boxplot(data=flights, x="year", y="passengers")
```

## Violineplot
```
sns.violinplot(data=flights, x="year", y="passengers")
```

## Swarmplot
```
sns.swarmplot(data=flights, x="year", y="passengers")
```
Boxplot, Violinplot, Swarmplot์ barplot๊ณผ ์ ์ฌํ๊ฒ x์ถ(์ฐ๋)๋ณ y์ถ(์น๊ฐ ์) ๊ฐ์ ํ์ํ์ง๋ง, ํ๋์ ๋ํ๊ฐ์ผ๋ก ํ์ํ๋ ๊ฒ์ด ์๋๋ผ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ธํ ์ ์๋๋ก ํ์ํฉ๋๋ค.

## Lineplot
```
sns.lineplot(data=flights, x="year", y="passengers")
```
์ ๊ทธ๋ํ๋ฅผ ๋์ํํ lineplot์
๋๋ค. ์์์ ๊ทธ๋ฆฐ barplot๊ณผ ๋์ผํ x, y์ถ ๋ฐ์ดํฐ๋ฅผ ์ค์ ํ์์ต๋๋ค.

barplot์ ๊ฐ์ฅ ์์ ์ ์ ํ๋์ ์ ์ผ๋ก ์ด์ ํํ์ ๊ทธ๋ํ๊ฐ ๊ทธ๋ ค์ก์ต๋๋ค. ์ ์ฃผ๋ณ์ ์
์ ํ๋์์ ๋ฐ์ดํฐ์ ์ ๋ขฐ๊ตฌ๊ฐ์ ํ์ํ ๊ฒ์
๋๋ค .์ฆ 1950๋
์๋ y์ถ ๋ฐ์ดํฐ(์น๊ฐ์)๊ฐ ์ฝ 150๋ถ๊ทผ์ ๋๋ถ๋ถ ๋ชฐ๋ ค์์๋ค๋ฉด 1960๋
์๋ 400~500 ์ฌ์ด์ ๋ถํฌํ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
## Distplot
displot์ ํ๋์ ๋ฐ์ดํฐ์ ๋ํด ๋ถํฌ๋ฅผ ํ์ธํ ๋ ์ฌ์ฉํฉ๋๋ค.
```
sns.distplot(flights["passengers"])
```

์น๊ฐ ๋ฐ์ดํฐ๋ 100~300 ์ฌ์ด์ ๋ง์ด ๋ถํฌํด์๋ค๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. displot์์๋ ๋ง๋(bin)๋ฅผ ์ฌ์ฉํ ํ์คํ ๊ทธ๋จ๊ณผ ๋ฐ๋๋ฅผ ์ ์ผ๋ก ์ด์ kde plot์ด ํจ๊ป ๊ทธ๋ ค์ง๋๋ค. ํ๋ผ๋ฏธํฐ ์ค์ ์ ํตํด ๋ง๋์ ๊ฐ์์ kde์ ํ์ ์ฌ๋ถ ๋ฑ์ ์ถ๊ฐ๋ก ์ค์ ํ ์ ์์ต๋๋ค. |
| Shard | 8 (laksa) |
| Root Hash | 5080710280345510808 |
| Unparsed URL | net,wikidocs!/86290 s443 |