본문 바로가기

pandas

pandas/Textual Categorical-Features/ordinal/nominal Textual Categorical-Features 데이터의 분석방식은 데어터 셋이 순서자료인지 아니면 명목자료인지에 따라(ordinal or nominal) 분류된다. ordinal 데이터가 순서자료일때는 증가형태의 정수를 설정하면된다. 만일 데이터가 설정된 정수형에 해당하지않는다면 '-1'로 표기될 것이다. >>> import pandas as pd >>> ordered_satisfaction = ['Very Unhappy', 'Unhappy', 'Neutral', 'Happy', 'Very Happy'] >>> df = pd.DataFrame({'satisfaction':['Mad', 'Happy', 'Unhappy', 'Neutral']}) >>> df.satisfaction = df.satisf.. 더보기
파이썬으로 공연예술 검색엔진 만들기(2) (3) 분석을 위한 데이터의 가공: 데이터는 가공되지 않으면 의미가 없으므로, 어떻게 어떤 정보를 Pyhton으로 추출했는지 설명함 사용 Library : 'BeatifulSoup' 과 'Pandas' HTML 및 XML 파일에서 원하는 데이터를 손쉽게 Parsing 할 수 있는 Python 라이브러리인 BeautifulSoup을 활용하였다. 이를 활용하여 HTML 코드 안에서 원하는 Data 를 뽑아내었다. Pandas는 파이썬에서 사용하는 데이터분석 라이브러리이다. 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하였다. 1. 공연시설 ID 추출 데이터 원본에서 공연장 ID, 공연시설 ID 추출 2. 공연시설 상세정보 (4) 분석 결과 도출: 논리적.. 더보기