Coding 공부/Python

파이썬 데이터 처리와 시각화의 필수 라이브러리: Numpy, Pandas, Matplotlib, Seaborn

CBJH 2024. 8. 8.
728x90
반응형

안녕하세요, 여러분! 오늘은 데이터 처리와 시각화에 필요한 파이썬 라이브러리 네 가지를 소개하려고 합니다. 바로 Numpy, Pandas, Matplotlib, 그리고 Seaborn입니다. 이 친구들이 어떤 역할을 하는지 하나씩 살펴볼까요?

Numpy: 수학의 친구

Numpy는 파이썬에서 수학적 연산을 도와주는 도구예요. 복잡한 수학 계산이나 대규모 데이터 처리를 빠르고 효율적으로 할 수 있도록 도와줍니다.

 
import numpy as np

# 배열 생성
array = np.array([1, 2, 3, 4, 5])

# 배열 연산
array_sum = np.sum(array)
array_mean = np.mean(array)

print("Sum:", array_sum)
print("Mean:", array_mean)

Pandas: 데이터의 친구

Pandas는 구조화된 데이터를 다루는 데 최적화된 라이브러리입니다. 엑셀 파일처럼 데이터 프레임이라는 형식으로 데이터를 관리할 수 있어요.

 
import pandas as pd

# 데이터 프레임 생성
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 데이터 조작
filtered_df = df[df['A'] > 1]

print(filtered_df)

Matplotlib: 시각화의 친구

Matplotlib는 다양한 그래프와 차트를 그릴 수 있는 시각화 도구입니다. 데이터를 보기 쉽게 그래프로 표현할 수 있어요.

 
import matplotlib.pyplot as plt

# 데이터 준비
x = [1, 2, 3, 4, 5]
y = [10, 20, 25, 30, 35]

# 그래프 그리기
plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Sample Plot')
plt.show()

Seaborn: 고급 시각화의 친구

Seaborn은 Matplotlib를 기반으로 한 고급 시각화 라이브러리입니다. 통계적 시각화를 위한 다양한 기능을 제공해요.

 
import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 준비
data = sns.load_dataset('tips')

# 히스토그램 그리기
sns.histplot(data['total_bill'], kde=True)
plt.show()

마무리

이렇게 Numpy, Pandas, Matplotlib, Seaborn을 함께 사용하면 데이터 분석과 시각화가 훨씬 더 쉬워집니다. 여러분도 이 친구들을 잘 활용해서 데이터와 더욱 친해져 보세요! 궁금한 점이나 추가로 알고 싶은 내용이 있다면 언제든지 댓글로 남겨주세요. 그럼, 다음에 또 만나요!

댓글