AI 기계 학습 입문서

기계 학습에 대해 알아야 할 사항

coffee/pixabay

출처 : coffee / pixabay

이미 인공 지능 (AI)으로 구동되는 서비스를 매일 사용하고있을 가능성이 있습니다. 그러나 기계 학습을 정확히하는 것은 무엇입니까? 인공 지능 기계 학습의 두포 엔진을 살펴 보겠습니다.

기계 학습은 작업을 수행하기 위해 명시 적 하드 코딩 (프로그래밍)이 필요하지 않은 인공 지능의 하위 집합입니다. 이것은 기계 학습 알고리즘에 많은 양의 데이터를 제공하여 학습하고 처리하는 방식으로 이루어집니다. 기계 학습은 감독자, 감독자, 감독자 또는 보강 방법에 따라 수행됩니다.

감독 된 기계 학습은 각 입력에 대해 레이블이 지정된 학습 데이터를 사용하며 알려진 출력 값이 있습니다. 감독 학습의 목표는 입력 및 출력 데이터 간의 관계를 가장 잘 평가하는 함수를 학습하는 것입니다. 감독되지 않은 학습에서는 입력 데이터와 관련된 출력 된 출력 교육 데이터가 없으므로 제공된 입력 교육 데이터로부터 추론하여 데이터 포인트 간의 유사점과 차이점을 식별합니다. 반 감독 기계 학습은 레이블이 지정된 교육 데이터를 사용합니다.

강화 학습 (RL)은 소프트웨어 에이전트가 환경과 상호 작용하여 보상을 최대화하는 목표를 통해 학습을 수행하는 방법입니다. Markov Decision Processes (MDP)는 일반적으로 보강 학습에 사용됩니다. MDP는 불확실한 환경에서 의사 결정을 수학적으로 모델링합니다.

인공 지능의 중심에는 컴퓨터 알고리즘에 사용되는 수학 및 통계, 문제 해결 절차가 있습니다. 회귀, 분류 또는 클러스터링을 수행하는 알고리즘은 일반적인 기계 학습 작업의 예입니다.

회귀의 개념은 1886 년과 1889 년에 각각 발표 된 유전 적 연구 논문 “유전 발달에있어서의 평범함으로의 회귀”와 “자연 유전”에 polymath Sir Francis Galton (Charles Darwin의 사촌)에 의해 소개되었습니다. “평균에 대한 회귀”는 다음에 측정 될 때 평균에 더 가깝게되는 표준 외적인 데이터 이상 값에 대한 현상입니다. 과학 용어로, 평균에 대한 회귀는 일반적으로 데이터 샘플링의 오류로 인해 발생합니다. 이는 표본 크기가 너무 작거나 표본이 무작위로 선택되지 않은 경우에 발생할 수 있습니다.

이것을 생각하는 방법은 우승이 임의의 이상치이기 때문에 카지노에서 앞서있을 때 “탁자에서 벗어나는”익숙한 격언의 맥락에 있으며, 시간이 지남에 따라 결과는 패배의 의미로 회귀 할 것입니다. 이기는 줄무늬는 흔치 않은 결과이며 기회가 많으면 계속해서 놀면 길을 잃을 것입니다.

선형 회귀는 기계 학습 알고리즘에서 예측 분석에 사용되는 회귀의 가장 간단한 형태입니다. 목표는 알고리즘의 실제 값과 예측 된 값 간의 오차를 최소화하는 것입니다. MSE (Mean Squared Error) 함수라고도하는 비용 함수는 예측 오류를 측정합니다.

Gradient descent는 비용 함수를 최소화하는 함수의 계수 (매개 변수) 값을 식별하는 데 사용되는 기계 학습을위한 최적화 알고리즘입니다.

선형 회귀는 상대적으로 간단하고 직선적입니다. 그러나 종종 주어진 데이터 세트에서 두 변수 간의 관계는 직접적으로 비례하지 않으므로 선형 회귀로 도출 할 수 없습니다. 기계 학습에서 일반적으로 비선형 회귀 기법이 사용됩니다. 비선형 회귀 알고리즘의 예에는 그래디언트 디센트, Gauss-Newton 및 Levenberg-Marquardt 방법이 있습니다.

다른 일반적인 기계 학습 작업은 분류입니다. 분류는 컴퓨터가 분류 된 학습 데이터로부터 학습하고 데이터의 클래스를 정확하게 예측한다는 목표에 따라 학습을 적용하는 감독 된 기계 학습입니다. 예를 들어, HBO의 코미디 “실리콘 밸리”에서 진통하는 캐릭터 중 하나 인 Jian-Yang은 핫도그가 아닌 핫도그로 이미지를 분류하기 위해 “핫도그가 아닌”AI 앱을 만들었습니다. 실제로, 쇼의 수석 기술 고문 인 Tim Anglade는 Not Hotdog 앱을 만들었습니다. 어떤 기계 학습에서도 교육의 양과 질이 중요합니다. 이 경우 Anglade는 매체 에 대한 블로그 게시물에 사용 된 초기 데이터 세트의 편견으로 인해 “프랑스 스타일의 핫도그, 아시아 핫도그 및 우리가 직접 경험하지 못한 이상한 점을 인식 할 수 없었습니다” 인공 지능은 “인간이 제공하는 훈련 세트를 통해 우리가 먹이가되는 것과 같은 인간 편견에 의해 영향을 받는다”고 말했다.

세 번째 주요 유형의 기계 학습 과제는 감독되지 않은 기계 학습을 통해 유사한 그룹에 레이블이 지정되지 않은 데이터를 구성하는 클러스터링입니다. 클러스터링의 개념을 설명하기 위해 인간 기반 통계 클러스터 분석의 예를 살펴 보겠습니다. MD 스노우먼 (John Snow, MD)이 수행 한 작업은 최초의 역학자 중 한 사람이었습니다. 닥터 스노우는 콜레라 사례를 찾아 냈으며 발발 집단이 물 펌프 근처에 있음을 확인했습니다. 그것이 나왔을 때, 그 펌프의 물은 콜레라가있는 아기의 더러운 기저귀로 오염되었습니다. 스노우 박사는 런던 소호 (SoHo) 근처에서 1854 년 주요 발병 중 콜레라가 수 인성 질병이었다고 이론화했다. 그의 상세한 분석을 바탕으로, 그는 콜레라가 그 당시 지배적 인 생각이었던 것처럼 “불행”( “나쁜 공기”)에 의한 것이 아니라고 결론 지었다.

최근 많은 산업 분야에서 AI (인공 지능) 투자가 급증한 것은 두 가지 이상의 신경망 계층을 기계로 학습하는 심층 학습 (deep learning)의 패턴 인식 기능 덕분입니다. 딥 학습은 비선형 처리를 사용하는 두 개 이상의 레이어로 구성된 신경 네트워크입니다. 심층 학습은 이미지 및 음성 인식에 사용되는 패턴 인식의 최첨단 기술입니다. 이 기술은 교육에 사용할 수있는 대규모 데이터 세트가있는 경우에 적합합니다.

AI는 소셜 미디어 앱, 인터넷 검색, 온라인 쇼핑 제안, 고객 서비스 봇, 맞춤 의학, 금융 거래, 산업 제조 관리, 의약품 발견, 사기 예방, 비즈니스 인텔리전스 분석, 인재 채용, 가상 비서, 자율 차량 , 번역 엔진, 안면 인식, 이미지를 컬러로 변환, 심지어는 에스 포트로 변환합니다. 수학, 통계, 데이터 과학 및 컴퓨터 과학 분야의 학제 간 분야는 기계 학습에 수렴합니다. 기계 학습은 우리가 살고 일하고 즐기는 방식을 빠르게 변화시키고 있습니다.

Copyright © 2019 Cami Rosso 모든 권리 보유.

참고 문헌

갈턴, 프란시스. “세습적 인 키의 평범함으로 회귀.” 맥밀란 . 1886. 검색된 2-4-2019 http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf

갈턴, 프란시스. “자연 유산.” 맥밀란 . 1889. 검색된 2-4-2019 http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf

긱스 포크. “기계 학습의 클러스터링”https://www.geeksforgeeks.org/에서 2014 년 2 월 4 일 검색 함

영국 축구 팀. “HBO의 실리콘 밸리가 어떻게 Mobile TensorFlow, Keras & React Native와 함께”Hotdog “을 구축하지 못했습니다.” Medium . 2017 년 6 월 26 일

Rogers, Simon. “John Snow의 데이터 저널리즘 : 세계를 변화시킨 콜레라지도” The Guardian . 2013 년 3 월 15 일