부스트캠프 AI Tech/[Week1] Python (4) 썸네일형 리스트형 [Week1] Python - pandas *pandas -> Python계의 엑셀! 구조화된 데이터의 처리를 지원하는 Python 라이브러리. panel data -> pandas 고성능 array계산 라이브러리인 numpy와 통합하여, 강력한 "스프레드시트"처리 기능을 제공 인덱싱, 연산용 함수, 전처리 함수 등을 제공 데이터 처리 및 통계 분석을 위해 사용 *Data loading ex1) df_data = pd.read_csv(data_url , sep='\s+' , header = None) #csv 타입 데이터 로드, separate은 regex로 빈공간으로 지정하고, Column은 없음 ex2) df_data.head() # 첫 5줄 출력 , integer로 몇 줄 출력할지 넣어줄 수 있음 *Series Data Table 전체를 포.. [Week1] Python - numpy *numpy Numerical Python 파이썬의 고성능 과학 계산용 패키지 Matrix와 Vector와 같은 Array 연산의 사실상의 표준 한글로 넘파이로 주로 통칭 *numpy 특징 일반 List에 비해 빠르고, 메모리 효율적 반복문 없이 데이터 배열에 대한 처리 지원 선형대수와 관련된 다양한 기능 제공 ex) dot , norm 등 굉장히 큰 Matrix에 리스트보다 메모리의 효율성 높음 *ndarray 특징 하나의 데이터 type만 배열에 넣을 수 있음 List와 가장 큰 차이점 -> dynamic typing not supported C의 Array를 사용하여 배열 생성 List와 메모리 저장 방법이 다름 *reshape Array의 shape의 크기를 변경함, element의 갯수는 동일 .. [Week1] Python - pythonic code *pythonic code? 파이썬 특유 문법을 의미하는 pythonic cnode 짧고 이해하기 편함 *Contents split & join list comprehension -> for loop append보다 빠름 enumerate & zip lambda & map & reduce generator asterisk *split 함수 string type의 값을 "기준값"으로 나눠서 List 형태로 반환 ex) items = "zero one two three" ex) items.split(" ") => ['zero' , 'one' , 'two' , 'three'] d *join 함수 string type의 값을 "기준값"으로 합침 ex) colors = ["red" , "blue" , "green.. [Week1] Python - Data Structure *자료구조 데이터 저장시, 데이터의 특징에 따라 컴퓨터에 효율적으로 정리하기 위한 데이터의 저장 및 표현 방식 *데이터 구조 생각해보기 전화번호부 정보는 어떻게 저장하면 좋을까? 은행 번호표 정보는 어떻게 처리하면 좋을까? 서적 정보는 어떻게 관리하면 좋을까? 창고에 쌓인 수화물의 위치를 역순으로 찾을 때? *자료구조 스택과 큐(stack & queue with list) 튜플과 집합(tuple & set) 사전(dictionary) Collection 모듈 *스택 (Stack) with list object 리스트를 사용하여 스택구조를 구현 가능 push를 append(), pop을 pop()를 사용 *큐 (Queue) with list object 리스트를 사용하여 큐 구조를 구현 가능 push를 a.. 이전 1 다음