SMALL resub1 [python] 문자열 tokenization! split과 re.sub 사용하기 간단한 문자열 처리! tokenization 방법과 너무나도 어려운 정규식 ㅠㅠ 먼저 문자열 데이터를 tokenizing 하는 방법은 다양한 방법이 있지만! 가장 간편한 방법으로 소개하려 한다. 1. Split split() 함수는 문자열을 일정한 규칙으로 잘라서 리스트로 만들어 주는 함수이다. split(sep = '구분자', maxsplit = '구분횟수') 문법으로 사용된다. 이때 sep의 default는 'none'이지만 띄어쓰기로 생각하면 된다! maxplit의 default는 -1로 최대 회수만큼 구분한다. temp = "Hi, my name is sophia" print(temp.split(',')) print(temp.split()) print(temp.split(maxsplit = 2)).. 2021. 12. 6. 이전 1 다음 LIST