우리는 논문에서 사용된 분류 기술에 대한 간략한 개요를 제시하면서 진행합니다.
기법
의사결정 트리
의사결정 트리는 거꾸로 된 트리 구조를 따르며 데이터를 가지로 나눕니다. 모델은 속성에 대해 내려야 할 결정을 나타내는 노드가 있는 순서도와 유사한 일련의 논리적 결정으로 구성됩니다. 분기는 결정의 선택을 반영합니다 [ 17 ].
각 분기의 노드는 클래스와 클래스 분포를 모두 나타냅니다. 트리에서 가장 큰 노드는 정보 이득이 가장 높은 루트 노드입니다[ 29 ]. 첫 번째 노드 이후에 정보 이득이 가장 높은 후속 노드 중 하나가 선택되어 다음 노드의 잠재적 요소로 테스트됩니다. 이 과정은 모든 변수가 비교되거나 표본을 나눌 수 있는 남은 변수가 없을 때까지 계속됩니다. 그런 다음 트리는 결정 조합, 클래스 또는 클래스 분포 비교와 관련된 경로를 표시하는 노드로 끝납니다.
랜덤 포레스트
Lantz [ 17 ] 에 따르면 의사결정 트리 세트를 기반으로 하는 Random Forest 방법은 단일 기계 학습 접근 방식에 다양성과 강력함을 결합합니다. 이 방법은 전체 관찰 세트 중 작은 무작위 부분만 사용하며 소위 "차원성의 저주"로 인해 다른 모델이 실패할 수 있는 대규모 데이터 세트를 처리할 수 있습니다.
이 접근 방식은 특성을 무작위로 선택하는 배깅의 기본을 사용하여 의사결정 트리 모델에 다양성을 추가합니다. 랜덤 포레스트가 생성된 후 모델은 투표 수[ 10 , 30 ]를 기반으로 한 절차에 따라 트리의 예측을 결합합니다.
구글상위노출구글상위노출스포츠중계사이트제작스포츠중계 제작구글상위노출온라인카지노소액결제현금화무료스포츠중계무료스포츠중계성인용품성인용품롤 토토롤 토토비제이벳강남달토강남레깅스룸구글 백링크
11
충북 제천시 수산면 상천리 289ㅣ TEL : 043-653-1034ㅣ사업자등록번호 : 304-05-73318ㅣ대표자 : 박봉소