전체 글

※ 본 게시물은 Pytorch 기초 강의 9. DQN 포스팅의 이해를 위해 작성한 부가 포스팅입니다. 강화학습(Reinforcement Learning) 강화학습 : 보상(reward), 처벌(penalty)를 미리 설계하고 스스로 환경을 경험하며 학습(from.포스팅) = 환경과 상호작용하여 좋은 점수를 얻는 방향으로 성장 = 사람은 목표를 설정해주고 당근과 채찍을 이용해 성장시키는 코치의 역할 강화학습의 구성요소 1. 에이전트(agent) : 인공지능 플레이어 2. 환경(environment) : 에이전트가 솔루션을 찾기 위한 무대 3. 행동(action) : 에이전트가 환경 안에서 시행하는 상호작용 4. 보상(reward) : 에이전트의 행동에 따른 점수 혹은 결과 강화학습의 사례 - 알파고 - 로..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. +) 본 포스팅은 기초 RL 용어는 알고 있다는 전제 하에 작성하였습니다. RL에 대한 기초적인 정보는 다른 포스팅을 참고해주시기 바랍니다. Model-Based Algorithm vs Model-Free Algorithm Model-based algorithm : 환경에 대해 이미 다 알고 학습 - 환경(environment)에 대해 알고 있고, 행동에 따른 환경 변화를 아는 알고리즘 - 어떤 state에서 어떤 ac..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. - GAN의 기초 - GAN으로 새로운 패션 아이템 생성하기 - cGAN으로 생성 제어하기 GAN이란 GAN(Generative Adversarial Network) - lan Goodfellow(2014)에서 제안한 네트워크 모델 - Unsupervised Learning(비지도학습)의 대표적인 알고리즘 - 서로 대립하는 역할의 두 모델이 경쟁하여 학습하는 방법론 G: Generative - GAN은 생성모델로 이미지..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. - Adversarial attack - FGSM attack Adversarial Attack 머신러닝 기반의 서비스가 많아지면서, 자연스럽게 보안의 중요성도 높아져가고 있다. 자율주행, 은행의 비정상거래탐지, 의료영상분석 모델 등 시스템 상 실수가 용납되지 않는 분야에서는 신뢰도를 떨어뜨리는 것 자체가 치명적이다. 자율주행차가 표지판을 못보도록, 의료진단 시스템이 병을 놓치는 등, 다양한 공격방법이 날로 증가하고 있..
· IoT
https://youtu.be/X8wMvr5hL5E 본 강좌를 보고 정리차원에서 작성하는 포스팅입니다. IoT(Internet of Things, 사물인터넷) 정의 : 센서가 부착된 사물(사용자의 단말기, 다양한 형태의 장치)을 연결해 데이터를 사람의 개입 없이 인터넷으로 주고 받는 기술 or 환경 - 지능적 환경: 사람-사물, 사물-사물 간 정보 교환 및 상호 통신(ITU) - 글로벌 네트워크 인프라 : 물리적 사물과 가상의 사물의 연결(FP7) - World-wide 네트워크 : 표준 통신 프로토콜 기반의 사물간 연결(IETF) IoT의 일반적 구조 1. 데이터 센싱 : 물리적 센서를 통한 사물과 주위 환경으로부터 data 채집 2. 네트워크를 통한 데이터 수집 : 인간 사물 서비스를 연결시킬 수 있..
https://youtu.be/GmqW_v_bXiM 본 유튜브 강의를 토대로 제 나름 정리한 포스팅입니다. 자세한 설명은 유튜브 영상을 참고하시기 바랍니다. 관련논문 Domain-Adversarial Training of Neural Networks We introduce a new representation learning approach for domain adaptation, in which data at training and test time come from similar but different distributions. Our approach is directly inspired by the theory on domain adaptation suggesting that, for effe a..
· Coding TEST
파이썬 내장함수 -참고 링크 Built-in Functions — Python 3.9.5 documentation Built-in Functions The Python interpreter has a number of functions and types built into it that are always available. They are listed here in alphabetical order. abs(x) Return the absolute value of a number. The argument may be an integer, a floating poin docs.python.org zip(*iterable) : iterable한 객체를 인수로 받으며 동일한 개수로 이루어진 자료형을 묶어서 ..
본 포스팅은 앞에서 다룬 RNN내용의 심화 내용으로, 3분 딥러닝 교재에 없던 LSTM과 GRU 내용을 담은 포스팅이다. RNN의 문제점 LSTM과 GRU가 나오게 된 배경으로, 기존 RNN에는 장기 의존성(Long-Term Dependency) 문제가 발생한다. 일반적인 RNN의 경우 아주 긴 문장을 입력해준다 가정하였을 때, 학습 도중에 기울기가 너무 작아지거나 커져서 앞부분에 대한 정보를 끝까지 가져오지 못할 확률이 높아진다. (Gradient vanishing/exploding) 아래 예제를 일반적인 RNN의 동작 방식은 $h_{t}$시점의 출력 결과가 이전의 $h_{t-1}$계산 결과에 의존한다. 다만, 이럴 경우 짧은 시퀀스(sequence)의 데이터에 대해서만 효과를 보이지, 긴 데이터의 경..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. - RNN(Recurrent Neural Network) - 영화 리뷰 감정 분석 - Seq2Seq 기계 번역 RNN(Recurrent Neural Network) 이전까지 다룬 이미지는 정적인 데이터이다. 이미지를 구성하는 가로, 세로 행렬 내에 정해진 숫자가 나열되어 있는 형태로 이 데이터는 외부의 조작이 있지 않는 이상, 시간이 지나도 변하지 않는다. - Sequential Data(시계열 데이터) : 데이터 집합..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. - Supervised learning / Unsupervised learning - AutoEncoder Supervised vs Unsupervised Learning 이전까지 다뤘던 분류 모델들은 대다수 정답이 존재하는 데이터들로, 지도 학습(Supervised learning)을 가능케 하는 문제들이다. 하지만, 대다수 실세계의 수집 데이터는 특정 정답이 없으며, 단순히 주어진 데이터들을 구분할 수 있는 특정 패..
Js.Y
Y초보프로그래머