7.9 (데이터엔지니어링) 정규표현식과 re모듈의 사용

정규표현식과 re모듈의 사용 (21:34)

정규표현식

raw string

문자열 앞에 r이 붙으면 해당 문자열이 구성된 그대로 문자열로 변환

a = 'abcdef\n' # escape 문자
print(a)

b = '^abcdef'
print(b)

'''
abcdef

^abcdef
'''

'''
search method
첫번째 패턴을 찾으면 match 객체 반환
패턴을 찾지 못하면 None
'''


import re
m = re.search(r'abc', '123abcdef')

print(type(m))
print(m.start())
print(m.end()) # 
print(m.group())

m = re.search(r'\d\d\d\w', '112abcdef119')
print(m.group()) # 가장 먼저 찾아지는 패턴을 return 함

# . : 어떤 문자든 ok
m = re.search(r'..\d\d\d', '112abcdef119')
print (m.group())

'''<class 're.Match'>
3
6
abc
112a
ef119
'''

문자들의 범위 표현

[] : 내부의 메타 캐릭터는 캐릭터 자체
[a-z] : - 은 범위
[a-zA-Z0-9] : 모든 영문자, 숫자
[^0-9] : 숫자가 아닌 것

re.search(r'[cbm]at', 'cat') # cbm 중에 하나, 그리고 at
'''
<re.Match object; span=(0, 3), match='cat'>
'''

re.search(r'[abc.^]aron', 'caron') # [] 안의 문자는 문자 그대로를 의미
'''
<re.Match object; span=(0, 5), match='caron'>
'''

re.search(r'[^abe]aron', 'daron') # ^가 맨 앞에 쓰일 경우 부정을 의미함 (즉, a가 아니거나, b가 아니거나, e가 아닌 것)
'''
<re.Match object; span=(0, 5), match='daron'>
'''

저작자표시

'DS > fast campus daily report' 카테고리의 다른 글

7.13 (딥러닝/인공지능)챕터 소개, 전체 구조 및 학습 과정, 딥러닝 용어- (0)	2020.07.14
7.11 (데이터엔지니어링) 클래스 연습문제 풀이, 정규표현식 연습문제 풀이 (0)	2020.07.11
7.8 (데이터엔지니어링) 클래스 상속, 클래스 연산자 재정의 이해 (0)	2020.07.08
7.7 (데이터엔지니어링) 생성자(_init_)이해 및 사용하기, self 키워드의 이해 및 사용하기, method, static method 정의 및 사용하기 (0)	2020.07.07
7.6 (데이터엔지니어링) 모듈의 이해 및 사용과 import 방법, 클래스 오브젝트 이해하기, 클래스 정의 및 사용하기 (0)	2020.07.06

7.9 (데이터엔지니어링) 정규표현식과 re모듈의 사용

정규표현식과 re모듈의 사용 (21:34)

정규표현식

raw string

문자들의 범위 표현

'DS > fast campus daily report' 카테고리의 다른 글

'DS/fast campus daily report' Related Articles

티스토리툴바