환경

  • Python
  • Pandas


사용법

  • 아래 예시들이 다 동일한 결과를 만든다.
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})

def modify_string(a):
    return a.upper() + "1"

def add_one(a):
    return a + 1

df['A'] = df['A'].apply(modify_string)
df['B'] = df['B'].apply(add_one)

df
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})


df['A'] = df['A'].apply(lambda x: x.upper() + "1")
df['B'] = df['B'].apply(lambda x: x + 1)

df
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})


df['A'] = df['A'].str.upper() + "1"
df['B'] += 1

df


참고자료


Environment and Prerequisite

  • Python
  • Pandas


Usage

  • Below samples make same result.
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})

def modify_string(a):
    return a.upper() + "1"

def add_one(a):
    return a + 1

df['A'] = df['A'].apply(modify_string)
df['B'] = df['B'].apply(add_one)

df
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})


df['A'] = df['A'].apply(lambda x: x.upper() + "1")
df['B'] = df['B'].apply(lambda x: x + 1)

df
import pandas as pd

df = pd.DataFrame({'A': ["a", "b", "c"], 'B': [4, 5, 6]})


df['A'] = df['A'].str.upper() + "1"
df['B'] += 1

df


Reference


환경

  • Python
  • Pandas


사용법

  • DataFrame에서 .str을 사용하면 된다.
import pandas as pd

df = pd.DataFrame(
    {'datetime': ['2022-02-28 10:30:00', '2022-03-01 11:45:00', '2022-03-02 12:15:00'], 'value': [1, 2, 3]}
)

# extract values using string slicing
df['date'] = df['datetime'].str[0:10]
df['year'] = df['datetime'].str[0:4]
df['month'] = df['datetime'].str[5:7]
df['day'] = df['datetime'].str[8:10]
df['time'] = df['datetime'].str[11:20]
df['hour'] = df['datetime'].str[11:13]
df['minute'] = df['datetime'].str[14:16]
df['second'] = df['datetime'].str[17:19]

df


참고자료


Environment and Prerequisite

  • Python
  • Pandas


Usage

  • Use .str in DataFrame.
import pandas as pd

df = pd.DataFrame(
    {'datetime': ['2022-02-28 10:30:00', '2022-03-01 11:45:00', '2022-03-02 12:15:00'], 'value': [1, 2, 3]}
)

# extract values using string slicing
df['date'] = df['datetime'].str[0:10]
df['year'] = df['datetime'].str[0:4]
df['month'] = df['datetime'].str[5:7]
df['day'] = df['datetime'].str[8:10]
df['time'] = df['datetime'].str[11:20]
df['hour'] = df['datetime'].str[11:13]
df['minute'] = df['datetime'].str[14:16]
df['second'] = df['datetime'].str[17:19]

df


Reference


환경

  • Python
  • Pandas


사용법

  • pd.to_datetime() 함수 사용
import pandas as pd

df = pd.DataFrame(
    {'datetime': ['2022-02-28 10:30:00', '2022-03-01 11:45:00', '2022-03-02 12:15:00'], 'value': [1, 2, 3]}
)

# convert the 'date' column to datetime type
df['datetime'] = pd.to_datetime(df['datetime'])

df['date'] = df['datetime'].dt.date
df['year'] = df['datetime'].dt.year
df['month'] = df['datetime'].dt.month
df['day'] = df['datetime'].dt.day
df['day_name'] = df['datetime'].dt.day_name()
df['time'] = df['datetime'].dt.time
df['hour'] = df['datetime'].dt.hour
df['minute'] = df['datetime'].dt.minute
df['second'] = df['datetime'].dt.second

df


참고자료