-
학습 알고리즘과 신경망 분류인공지능 2020. 4. 23. 16:11
심층 신경망
심층 신경망은 입력층과 출력층 사이에 여러개의 은닉층들로 이루어진 인공신경망이다.
심층 신경망은 일반적인 인공신경망과 마찬가지로 복잡한 비선형 관계들을 모델링할 수 있다.
예를 들어, 사물 식별 모델을 위한 심층 신경망 구조에서는 각 객체가 이미지 기본 요소들의
계층적 구성으로 표현될 수 있다. 이때, 추가 계층들은 점진적으로 모여진 하위 계층들의 특징들을 규한시킬 수 있다.
심층 신경망의 이러한 특징은, 비슷하게 수행된 인 공신경망에 비해 더 적은 수의 유닛들 만으로도 복잡한 데이터를
모델링할 수 있게 해준다.
이전의 심층 신경망들은 보통 앞먹임 신경망으로 설계되어 왔지만, 최근의 연구들은
심층 학습 구조들을 순환 신경망에 성공적으로 적용했다. 일례로 언어 모델링 분야에 심층 신 경망 구조를 적용한
사례등이 있다. 합성곱 신경망의 경우에는 컴퓨터 비전 분야에서 잘 적용되었을 뿐만 아니라,
각각의 성공적인 적용 사례에 대한 문서화 또한 잘 되어 있다.
더욱 최근에는 합성곱 신경망이 자동 음성인식 서비스를 위한 음향 모델링 분야에 적용 되었으며,
기존의 모델들 보다 더욱 성공적으로 적용되었다는 평가를 받고 있다.
심층 신경망은 표준 오류역전파 알고리즘으로 학습될 수 있다.이때, 가중치들은 아래의 등식을 이용한 확률적 경사 하강법을 통하여 갱신될 수 있다.
합성곱 신경망
합성곱 신경망(Convolutional Neural Network, CNN)은 최소한의 전처리(preprocess)를 사용하도록
설계된 다계층 퍼셉트론(multilayer perceptrons)의 한 종류이다.
CNN은 하나 또는 여러개의 합성곱 계층과 그 위에 올려진 일반적인 인공 신경망 계층들로 이루어져 있으며,
가중치와 통합 계층(pooling layer)들을 추가로 활용한다. 이러한 구조 덕분에 CNN은 2차원 구조의 입력 데이터를
충분히 활용할 수 있다. 다른 딥 러닝 구조들과 비교해서, CNN은 영상, 음성 분야 모두에서 좋은 성능을 보여준다.
CNN은 또한 표준 역전 달을 통해 훈련될 수 있다. CNN은 다른 피드포워드 인공신경망 기법들보다 쉽게
훈련되는 편이고 적은 수의 매개변수를 사용한다는 이점이 있다. 최근 딥 러닝에서는 합성곱 심층 신뢰 신경망
(Convolutional Deep Belief Network, CDBN) 가 개발되었는데, 기존 CNN과 구조적으로 매우 비슷해서,
그림의 2차원 구조를 잘 이용할 수 있으며 그와 동시 에 심층 신뢰 신경망 (Deep Belief Network, DBN)에서의
선훈련에 의한 장점도 취할 수 있다. CDBN은 다양한 영상과 신호 처리 기법에 사용될 수 있는 일반적인 구조를 제공하
며 CIFAR 와 같은 표준 이미지 데이터에 대한 여러 벤치마크 결과에 사용되고 있다.
순환 신경망(RNN)
순환 신경망은 인공신경망을 구성하는 유닛 사이의 연결이 Directed cycle을 구성하는 신경망을 말한다.
순환 신경망은 앞먹임 신경망과 달리, 임의의 입력을 처리하기 위해 신경 망 내부의 메모리를 활용할 수 있다.
이러한 특성에 의해 순환 신경망은 필기체 인식 (Handwriting recognition)과 같은 분야에 활용되고 있고,
높은 인식률을 나타낸다. 순환 신경망을 구성할 수 있는 구조에는 여러가지 방식이 사용되고 있다.
완전 순환망(Fully Recurrent Network), Hopfield Network, Elman Network, Echo state network(ESN), Long short term
memory network(LSTM), Bi-directional RNN, Continuous-time RNN(CTRNN), Hierarchical RNN, Second Order RNN 등
이 대표적인 예이다. 순환 신경 망을 훈련(Training)시키기 위해 대표적으로 경사 하강법, Hessian Free Optimization,
Global Optimization Methods 방식이 쓰이고 있다.
하지만 순환 신경망은 많은 수의 뉴런 유닛이나 많은 수의 입력 유닛이 있는 경우에 훈련이 쉽지 않은
스케일링 이슈를 가지고 있다.
심층 신뢰 신경망
심층 신뢰 신경망(Deep Belief Network, DBN)이란 기계학습에서 사용되는 그래프 생성 모형
(generative graphical model)으로, 딥 러닝에서는 잠재변수(latent variable)의 다중계 층으로 이루어진
심층 신경망을 의미한다. 계층 간에는 연결이 있지만 계층 내의 유닛 간 에는 연결이 없다는 특징이 있다.
DBN은 생성 모형이라는 특성상 선행학습에 사용될 수 있고, 선행학습을 통해 초기 가중 치를 학습한 후 역전파
혹은 다른 판별 알고리즘을 통해 가중치의 미조정을 할 수 있다.
이러한 특성은 훈련용 데이터가 적을 때 굉장히 유용한데, 이는 훈련용 데이터가 적을수 록 가중치의 초기값이
결과적인 모델에 끼치는 영향이 세지기 때문이다. 선행학습된 가중 치 초기값은 임의로 설정된 가중치 초기값에 비해
최적의 가중치에 가깝게 되고 이는 미 조정 단계의 성능과 속도향상을 가능케 한다.
DBN은 비지도 방식으로 계층마다 학습을 진행하는데 이때 각각의 계층은 보통 RBM의 형태를 띄고 있다.
RBM들을 쌓아 올리면서 DBN을 훈련시키는 방법에 대한 설명은 아래 에 제공 되어 있다.
RBM은 에너지 기반의 생성 모형으로 가시 유닛과 은닉 유닛으로 이 루어진 무방향 이분 그래프 형태이다.
가시 유닛들과 은닉 유닛들 사이에만 연결이 존재 한다.
RBM이 훈련되고 나면 다른 RBM이 그 위에 쌓아 올려짐으로써 다중 계층 모형을 형성한다.RBM이 쌓아 올려질 때마다, 이미 훈련된 RBM의 최상위 계층이 새로 쌓이는 RBM의 입력으로 쓰인다.
이 입력을 이용하여 새 RBM이 훈련되고, 원하는 만큼의 계층 이 쌓일 때까지 해당 과정이 반복된다.
실험결과에 따르면, CD의 최대가능도 근사가 굉장히 투박함에도 불구하고, 심층 신경망 구조를 학습하기에는충분히 효과적인 방식이라고 한다.
'인공지능' 카테고리의 다른 글
단 / 다층 퍼셉트론 (0) 2020.04.23 인공 신경망(뉴럴 네트워크) (0) 2020.04.23 딥러닝 (0) 2020.04.23 지도 / 비지도 학습과 강화학습 (0) 2020.04.23 회귀분석 (0) 2020.04.23