Machine Learning

    사이킷런 개요

    사이킷런 소개 - https://scikit-learn.org/stable/ - 쉽고 파이썬스러운 API 제공 - 머신러닝에 필요한 다양한 알고리즘과 편리한 프레임 워크, API 제공 - 오랜기간 실전 환경에서 검증되었고 매우 많은 환경에서 사용 - 주로 Numpy와 Spicy 기반 위에 구축된 라이브러리 사이킷런 장점 - 자유롭게 사용하거나 배포 가능 - 누구나 소스 코드를 보고 실제로 어떻게 동작하는지 쉽게 확인 - 꾸준히 개발, 향상되고 있고 커뮤니티 활발 - 알고리즘을 설명한 풍부한 문서 - 산업 현장이나 학계에서도 널리 사용 - 많은 튜토리얼과 예제 코드를 온라인에서 쉽게 확인 - 다른 파이썬의 과학 패키지들과 연동 알고리즘 선택 가이드 사이킷런의 설계 철학 - 일관성 추정기 (estimator..

    머신러닝 알고리즘의 개요

    머신러닝 시스템의 종류 - 사람의 감독하에 훈련하는 것인지 그렇지 않은 것인지 지도 학습 (supervised learning) 비지도 학습 (unsupervised learning) 준지도 학습 (semisupervised learning) 강화 학습 (reinforcement learning) - 실시간으로 점진적인 학습을 하는지 아닌지 온라인 학습 배치학습 - 훈련 데이터와 단순 비교인지, 패턴을 찾기 위해 예측 모델을 만드는지 사례 기반 학습 모델 기반 학습 - 위의 범주들은 배타적이지 않음 (e.g. 온라인 모델 기반 지도학습) 지도학습 (Supervised Learning) - 머신러닝 용어 훈련 세트 (training set) : 머신러닝이 학습하는데 사용하는 샘플 훈련 사례 (trainig..

    파이썬 기반의 머신러닝

    왜 파이썬인가 - 데이터 분석 측면 데이터 적재, 시각화, 통계, 자연어, 이미지 처리 등에 필요한 라이브러리 제공 주피터 노트북 같은 도구로 대화하듯 프로그래밍 반복적인 데이터 분석 작업을 빠르고 손쉽게 조작하게 해줌 - 범용적 측면 그래픽 처리나 웹서비스도 제작 가능 기존시스템과 통합하기에도 유리 - 단점 Interpreter 언어 특성상 속도가 느림 실시간 거래 시스템처럼 매우 짧은 응답 시간을 필요로 하는 애플리케이션에 부적합 동시다발적인 멀티스레드를 처리하거나 CPU에 집중된 많은 스레드를 처리하기엔 부적합 - 머신 러닝 측면 많은 라이브러리, 뛰어난 생산성 Google, Facebook 등 유수의 IT업계에서 활용 오픈 소스 계열의 전폭적인 지원 분석 영역을 넘어 머신러닝 기반의 다양한 App..

    머신러닝 개요

    머신러닝의 예 - 우리 주변 머신러닝 - 광학문자 판독기(OCR) - 스팸필터 - 추천과 음성 검색으로 발전 - 고객에 따른 타겟 광고 - 선거 결과 예상, 도로 상태에 따른 신호 조절 - 자연 재해의 경제적 측정 산출 - 자동 운전 차량과 자동 항법 비행기 구현 - 최근 많은 웹사이트와 기기가 머신러닝 알고리즘을 핵심 기술로 채택 - 구글, 페이스북, 아마존, 넷플릭스 - 다양한 과학 분야 - 별을 탐구하고 새로운 행성을 찾는 과제 - 새로운 미립자를 발견하고 DNA 서열 분석 - 맞춤형 암 치료법을 만드는 일 등 머신러닝이란 - "머신러닝" 은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.(아서 사무엘, 1959) - 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 ..

    독립시행의 확률

    독립시행 (independent trial) : 몇 개의 시행이 있고 어떤 시행의 결과도 다른 시행의 결과에 영향을 미치지 않을 때의 각 시행 종속시행 (dependent trial) : 일반적으로 시행 몇 개가 독립시행이 아닐 때의 시행 복원추출 (with replacement) : 한 번 추출한 표본이 다시 추출 대상이 될 수 있는 방법 비복원추출 (without replacement) : 한 번 추출한 표본은 이후 추출 대상이 되지 않는 방법 Q. 독립시행의 확률 주머니 A에는 파란 구슬 2개와 흰 구슬 2개, 주머니 B에는 파란 구슬 2개와 흰 구슬 1개가 있다고 가정할 시 각 주머니에서 1개씩 구슬을 꺼낼 때 모두 파란 구슬일 확률 A에서 파란 구슬을 꺼낼 확률 2/4 B에서 파란 구슬을 꺼낼 ..

    사건과 확률

    시행 (trial) : 몇 번이나 반복할 수 있고 결과가 우연에 좌우되는 실험이나 관측 : 주사위 던지기, 동전 던지기 등 표본 공간 (sample space) : 어떤 시행을 했을 때 일어날 수 있는 모든 결과를 모은 집합 : 주사위를 던지는 시행의 표본공간 {1, 2, 3, 4, 5, 6} 사건 (event) : 표본 공간의 부분 집합 : 주사위를 던졌을 때 짝수가 나오는 경우 {2, 4, 6} 근원사건 (atom) : 표본 공간의 단 하나의 성분으로 만들어지는 부분 집합 : 주사위를 던지는 시행의 근원사건 {1}, {2}, {3}, {4}, {5}, {6} Q 10원짜리 1개와 100원짜리 1개를 동시에 던지는 시행에서 '10원짜리가 앞, 100원짜리가 뒤'인 사건을 (앞, 뒤)로 표기한다고 할 때..