본문 바로가기

부스트캠프 AI Tech

(42)
[Data viz(1)] Inroduction to Visualization *데이터 시각화란? 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것 시각화는 다양한 요소가 포함된 Task 목적 - 왜 시각화 하는지? 독자 - 시각화 결과는 누구를 대상으로 하는지? 데이터 - 어떤 데이터를 시각화할 것인지? 스토리 - 어떤 흐름으로 인사이트를 전달할 것인지? 방법 - 전달하고자 하는 내용에 맞게 효과적인 방법을 사용하고 있는지? 디자인 - UI에서 만족스러운 디자인을 가지고 있는지? raw data만 처리하는게 아니라 원하는 정보를 추출할 수 있어야 함 => ex) Preprocessing Data의 전체적인 흐름을 알 필요가 있음 => 흐름을 잘 전달하기 위한 Bar plot, Line plot, Scatter plot 등... 1.1 '데이터' 시각화 데이터 시각화를 위해서..
[Week1 - 필수과제3] Text_Processing2 *내용 string 다루기 인풋으로 받는 string을 숫자만 추출하여 영어로 변환 Problem1) 인풋으로 받는 string중 숫자만 추출 def digits_to_words(input_string): """ Parameters: input_string (string): 영어로 된 대문자, 소문자, 띄어쓰기, 문장부호, 숫자로 이루어진 string ex - "Zip Code: 19104" Returns: digit_string (string): 위 요건을 충족시킨 숫자만 영어단어로 추출된 string ex - 'one nine one zero four' """ digit_string = None word = "" for i in input_string: if(i=="0"): word+="zero " ..
[Week1 - 필수과제2] Text_Processing_1 *내용 Python String 다루는 방법 여러가지 조건으로 string 변환 Problem1) 인풋으로 받는 스트링에서 정규화된 스트링 반환 def normalize(input_string): """ * 모든 단어들은 소문자로 되어야함 * 띄어쓰기는 한칸으로 되어야함 * 앞뒤 필요없는 띄어쓰기는 제거해야함 Parameters: input_string (string): 영어로 된 대문자, 소문자, 띄어쓰기, 문장부호, 숫자로 이루어진 string ex - "This is an example.", " EXTRA SPACE " Returns: normalized_string (string): 위 요건을 충족시킨 정규회된 string ex - 'this is an example.' """ normalized..
[Week1 - 필수과제1] Basic Math *내용 python 기초 list , variable math function Problem1) 주어진 리스트에서 가장 큰 숫자를 반환함 def get_greatest(number_list): """ Parameters: number_list (list): integer로 값으로만 구성된 list ex - [10, 33, 22, 99, 33] Returns: greatest_number (int): parameter number_list 중 가장 큰 값 """ greatest_number = None number_list.sort() greatest_number = number_list[-1] return greatest_number Problem2) 주어진 리스트에서 가장 작은 숫자를 반환함 def g..
[Week1] AI Math - CNN & RNN 1. Convolution Convolution 연산은 커널(kernel)을 입력벡터 상에서 움직여가면서 선형모델과 합성함수가 적용되는 구조 기존에 배웠던 신경망에서는 가중치행렬을 학습시키지만 Convolution은 고정된 커널을 사용하는것이 특징 Convolution 연산의 수학적인 의미는 신호를 커널을 이용해 국소적으로 증폭 또는 감소시켜 정보를 추출 또는 필터링하는것 커널은 정의역 내에서 움직여도 변하지 않고(translation invariant) 주어진 신호에 국소적(local)으로 적용. *dimensions Convolution 연산의 다양한 차원 *2차원 Convolution 2D-Conv 연산은 커널을 입력벡터 상에서 움직여가면서 선형모델과 합성함수가 적용되는 구조 입력 크기를 (H,W)..
[Week1] Python - pandas *pandas -> Python계의 엑셀! 구조화된 데이터의 처리를 지원하는 Python 라이브러리. panel data -> pandas 고성능 array계산 라이브러리인 numpy와 통합하여, 강력한 "스프레드시트"처리 기능을 제공 인덱싱, 연산용 함수, 전처리 함수 등을 제공 데이터 처리 및 통계 분석을 위해 사용 *Data loading ex1) df_data = pd.read_csv(data_url , sep='\s+' , header = None) #csv 타입 데이터 로드, separate은 regex로 빈공간으로 지정하고, Column은 없음 ex2) df_data.head() # 첫 5줄 출력 , integer로 몇 줄 출력할지 넣어줄 수 있음 *Series Data Table 전체를 포..
[Week1] Python - numpy *numpy Numerical Python 파이썬의 고성능 과학 계산용 패키지 Matrix와 Vector와 같은 Array 연산의 사실상의 표준 한글로 넘파이로 주로 통칭 *numpy 특징 일반 List에 비해 빠르고, 메모리 효율적 반복문 없이 데이터 배열에 대한 처리 지원 선형대수와 관련된 다양한 기능 제공 ex) dot , norm 등 굉장히 큰 Matrix에 리스트보다 메모리의 효율성 높음 *ndarray 특징 하나의 데이터 type만 배열에 넣을 수 있음 List와 가장 큰 차이점 -> dynamic typing not supported C의 Array를 사용하여 배열 생성 List와 메모리 저장 방법이 다름 *reshape Array의 shape의 크기를 변경함, element의 갯수는 동일 ..
[Week1] Python - pythonic code *pythonic code? 파이썬 특유 문법을 의미하는 pythonic cnode 짧고 이해하기 편함 *Contents split & join list comprehension -> for loop append보다 빠름 enumerate & zip lambda & map & reduce generator asterisk *split 함수 string type의 값을 "기준값"으로 나눠서 List 형태로 반환 ex) items = "zero one two three" ex) items.split(" ") => ['zero' , 'one' , 'two' , 'three'] d *join 함수 string type의 값을 "기준값"으로 합침 ex) colors = ["red" , "blue" , "green..