세 개의 레이어 그룹 후에는 완전히 연결된 두 개의 레이어가 있습니다. 병합은 입력 역할을 수행합니다. 다음은 밀도 – 출력 공간 (64) 및 Relu 활성화 기능의 값으로 조밀하게 연결된 레이어입니다. 그것은 오버 피팅을 방지하는 드롭 아웃을 따릅니다. 오버피팅은 구성된 모델이 학습 샘플의 예제를 인식하지만 테스트 샘플의 예제에서는 상대적으로 제대로 작동하지 않습니다. 드롭아웃은 0에서 1 사이의 값을 취합니다. 마지막으로 완전히 연결된 계층에는 1 개의 출력과 시그머노이드 활성화 기능이 있습니다. 이러한 모든 출력을 2D로 연결하면 크기 28*28의 출력 활성화 맵이 있습니다(32*32에서 28*28이 5*5 및 보폭 1의 필터로 왜 28*28인지 생각할 수 있습니다). 일반적으로 하나의 컨볼루션 레이어에 1개 이상의 필터를 사용합니다. 예제에서 6개의 필터가 있는 경우 크기 28*28*6의 출력을 갖습니다. 신경망의 마지막 물결은 컴퓨팅 파워의 증가와 경험의 축적과 관련이 있습니다.

이로 인해 딥 러닝은 신경망의 기술 구조가 더욱 복잡해지고 이전에는 효과적으로 해결할 수 없었던 광범위한 작업을 해결할 수 있게 되었습니다. 이미지 분류는 눈에 띄는 예입니다. 컴퓨터 비전과 신경망은 기계 학습 기술의 새로운 IT입니다. 신경망의 발전과 픽셀 밀도 숫자로 이미지를 읽을 수 있는 기능으로 많은 기업들이 이 기술을 사용하여 더 많은 데이터를 찾고 있습니다. 예를 들어, Speed Camera는 컴퓨터 비전을 사용하여 과속 제한을 초과하는 자동차의 번호판 사진을 찍고 번호판 번호를 알려진 데이터베이스와 일치하여 티켓을 전송합니다. 이는 이미지 분류보다 개체 문자 인식과 더 관련이 있지만 둘 다 컴퓨터 비전과 신경망을 작동의 기반으로 사용합니다. 이미지에는 5×5 피처 맵과 3×3 필터가 있습니다. 필터가 3×3 그리드를 가넬 수 있는 가운데에는 창이 하나뿐입니다. 출력 피처 맵은 3×3 차원과 함께 두 개의 타일로 축소됩니다. 이 코드는 실제 예제인 경우 약간 길다. 따라서 여기로 이동하여 코드를 복제하고 train.py 파일을 실행하여 교육을 시작하십시오.

이것은 출력이 어떻게 보일 지 입니다 : 그런 다음 이미 설명 된 이미지 데이터 생성기가 교육 및 시음 샘플을 위해 추가됩니다. 그러나 리스케일이라고 하는 새로운 변환이 있습니다. 지정된 값에 데이터를 곱합니다. 이미지 분류의 보다 현실적인 예는 Facebook 태그 지정 알고리즘입니다. 상대방과 함께 앨범을 업로드하고 Facebook에 태그를 붙이면 태그 알고리즘이 사용자의 사진 픽셀 위치를 세분화하여 데이터베이스에 저장합니다. 각 사진은 고유한 픽셀 위치를 가지고 있기 때문에 알고리즘이 데이터베이스에 있는 이전 사진을 기반으로 누가 누구인지 를 쉽게 파악할 수 있습니다. 물론 알고리즘은 때때로 실수를 할 수 있지만, 더 당신이 그것을 수정, 더 나은 당신이 업로드 할 때 친구를 식별하고 자동으로 당신을 위해 그들을 태그에있을 것입니다. 그러나 Facebook 태그 알고리즘은 인공 지능을 염두에 두고 구축되었습니다. 즉, 태그 지정 알고리즘은 입력을 기반으로 학습하고 나중에 더 나은 분류를 만들 수 있습니다. Facebook이 그룹 사진에 있는 사람들에게 라벨을 붙이는 방법을 궁금해한 적이 있습니까? 그럼 당신이 있다면, 여기에 대답입니다.

당신이 보는 매력적이고 멋진 찾고 사용자 인터페이스 뒤에, 당신이 페이스 북에 업로드 하는 모든 그림의 얼굴을 인식 하는 복잡 한 알고리즘그리고 그들은 항상 개선 을 배우고 있다. 이미지 분류는 AI가 해결에 적용되는 가장 일반적인 문제 중 하나입니다. 이 문서에서는 CNN의 기본 사항과 이미지 분류 작업에 사용하는 방법에 대해 설명합니다.