'IT/Python' 카테고리의 글 목록
본문 바로가기

IT/Python23

[Python]인덱스번호로 데이터프레임 행 삭제 nullIdx_lst = [149,234,567,....] * 삭제할 인덱스가 담긴 리스트로 행삭제 2021. 10. 20.
[Python]특정행의 NaN값을 0으로 바꾸기 1. in[18]번의 방법으로 실행했으나 0으로 바뀌지 않고 NaN값으로 그대로 있음 2. in[35]번 방법으로 실행했으나 'float' object has no attribute 'fillna'라는 에러발생 3. in[38]번 방법으로 실행했더니 해결됨 2021. 10. 20.
[Python]_토큰화_형태소분석기_Okt, Kkma, Mecab 형태소 분석기를 사용하기위해 반드시 CMD를 관리자 권한으로 실행해 install 을 진행해야함 pip install konlpy stopwords_txt 에는 본인이 제거하고 싶은 불용어를 넣으시면 되요! 1. Okt stopwords_txt = ["고", "를", "을"] from konlpy.tag import Okt okt=Okt() df['Okt'] = df['본문'].apply(okt.morphs) df['Okt'] = df['Okt'].apply(lambda x: [item for item in x if item not in stopwords_txt]) df 2. 꼬꼬마, Kkma from konlpy.tag import Kkma kkma=Kkma() df['Kkma'] = df['본문']... 2021. 8. 25.
파이썬 전화번호, 이메일 정규표현식으로 제거 1. 전화번호 패턴 제거 import re phoneNumRegex = re.compile(r'\d{2}-\d{3}-\d{4}') for i in range(len(df)): for phoneNum in phoneNumRegex.findall(df["본문"][i]): df['본문'][i] = df['본문'][i].replace(phoneNum, " ") 2. 이메일 패턴 제거 emailRegex = re.compile('[a-zA-Z0-9_-]+@[a-z]+.[a-z]+') for i in range(len(df)): for email in emailRegex.findall(df["본문"][i]): df['본문'][i] = df['본문'][i].replace(email, " ") 2021. 8. 25.