본문 바로가기

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

조회 수 770 추천 수 0 댓글 0

  Contents 

  1. 최신 AI 논문 보는 곳

  2. 모든 분야 논문 정리

  3. 분야별 논문
   3.1. Computer Vision 논문

   3.2. NLP 논문

   3.3. Recommendation 논문
   3.4. Tabular data 논문

  4. 기업의 AI 논문

  5. 논문은 아니지만 유용한 기술 블로그

 

 

1. 최신 AI 논문 보는 곳

 

1) 분야별 최신 논문 볼 수 있는 사이트 - paperswithcode

Papers with Code - The Methods Corpus

982 methods • 54838 papers with code.

paperswithcode.com

 

2) 아직 학회에 발표되지는 않았지만 완전 최신 논문 볼 수 있는 사이트 - arxiv

 

Arxiv Sanity Preserver

 

arxiv-sanity.com

 


 

2. 모든 분야 논문 정리

 

1) Papers You Must Read -  www.notion.so/c3b3474d18ef4304b23ea360367a5137?v=5d763ad5773f44eb950f49de7d7671bd

Papers You Must Read

Data Science & Business Analytics Lab School of Industrial Management Engineering Korea University Homepage: http://dsba.korea.ac.kr/ Youtube: https://www.youtube.com/channel/UCPq01cgCcEwhXl7BvcwIQyg Reading loadmap: https://www.dropbox.com/s/5x9u0rnsxos8q

www.notion.so

2) github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap

floodsung/Deep-Learning-Papers-Reading-Roadmap

Deep Learning papers reading roadmap for anyone who are eager to learn this amazing tech! - floodsung/Deep-Learning-Papers-Reading-Roadmap

github.com

 

3) 책 "핸즈온 머신러닝 2판" - 2019년 책 pdf

CNN, NLP 등 각 분야 시작 논문부터~최신 논문 경향까지 설명하고 있는 책이기에, 전반적인 모든 분야에 대한 논문 요약을 보고 싶을 때 추천하는 책이다. 각 설명이 어떤 논문에서 나왔는지도 주석으로 달려 있기에 추가 공부를 하고 싶으면 해당 논문을 찾아볼 수 있다.

 


3. 분야별 논문

 

3.1. Computer Vision 논문

 

Computer Vision 분야의 주요 task는

1) image classification,

2) Single Classification & Localization & Detection, 

3) Multiple Object Detection & Localization & Classification

이렇게 3가지로 나뉜다.

 

image classification으로 CNN을 처음 접하게 됐지만, 현업에서는 image classification을 하는 일은 거의 없는 것 같다. 이미 이쪽은 너무 좋은 모델들이 많아서 굳이 모델러의 손길이 필요한 것 같지 않다. 다만 현업의 데이터셋 특성 때문에 여전히 이미지 분류가 잘 안 되는 경우가 많은데, 가령 공장 이미지는 label이 잘못 저장되어 있거나, 사진 자체가 제각각 이상하게 찍혀서 분류를 하기가 힘들다는 데이터셋 상의 문제가 있다. 또, 사진 자체가 너무 부족하다거나! 그래서 image classification 쪽은 모델을 얼마나 잘 만드냐보다, relabeling, data augmentation이 더 많이 필요한 것 같다. 모델 자체는 정말 공부하다 보면 하나도 안 어렵다.

 

CNN의 또 다른 분야는 object detection이 있는데, single detection, multiple detection이 있다. 자율주행차, 쇼핑 등에 쓰여서 이 분야는 계속 성장할 것 같다.

 

 

1) Computer Vision 강의 - 논문으로 짚어보는 딥러닝의 맥 www.edwith.org/deeplearningchoi/joinLectures/10979

논문으로 짚어보는 딥러닝의 맥 강좌소개 : edwith

- 최성준

www.edwith.org


3.2. NLP 논문

 

NLP 분야는 ACL, EMNLP, NAACL 대표적인 Top Conference 학회에 속한다.

 

NLP의 하위 분야에는 음성 인식, 언어 이해, 대화 관리, 언어 생성, 음성 합성 등이 있다.

한국어 자체가 희소성 있는 언어에 속하다 보니까, 개인적인 생각으로는 한국어 자체에 대한 연구보다는

주로 기계번역(한글<->영어, 중국어 등), 음성 인식(음성->한글), 챗봇쪽으로 연구가 흘러가는 것 같다. 

 

NLP 입문하기에는 "밑바닥부터 시작하는 딥러닝2"와 위키독스가 정말 좋다. 

이 책 2권에는 통계적 모델부터 rnn, lstm, gru, transformer까지 설명되어 있는데 

최신 NLP 논문 보기 전에 공부하기 좋은 책이다.

 

1) 책 "밑바닥부터 시작하는 딥러닝2" 

통계적 모델, word2vec, rnn, lstm, gru, transformer 등에 대해 설명하고 있는 책

 

 

2) 온라인책 "딥러닝을 이용한 자연어 처리 입문" wikidocs.net/book/2155

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

 

3) 카카오브레인 NLP 깃헙 - github.com/kakaobrain/nlp-paper-reading

kakaobrain/nlp-paper-reading

Paper reading notes from Kakao Brain's NLP team. Contribute to kakaobrain/nlp-paper-reading development by creating an account on GitHub.

github.com

 


3.3. Recommendation 논문

 

추천시스템의 기본은 Content-based filtering, Collaborative filtering 이다. 

 

Content-based filtering은 특정 아이템에 기반해 비슷한 아이템을 추천해주는 것으로,

유저가 어떤 아이템 A(호러, 무서움, 2019 등등)을 좋아하면 A와 속성이 비슷한 다른 아이템을 추천해주는 걸 말한다.

 

한편 Collaborative filtering은 사용자 그룹이 형성되어 있고, 그들의 평가점수와 선호도를 고려해서 나와 비슷한 다른 사용자가 선호하는 아이템을 추천해주는 것이다.

나와 유사한 아이템을 평소에 좋아했던 친구가 B라는 아이템도 선호한다면, 내게 B라는 아이템을 추천해주는 걸 말한다.

 

 

 

 

기본은 이 2가지인데, 각각의 문제점들이 있어서 hybrid해서 쓰거나, 

최근에는 knowledge graph 기반 추천시스템이 더 핫한 것 같다.

각 아이템에 대한 속성을 graph로 표현하면 더 잘 나타낼 수 있다는 것도 있고, 

특정 유저가 어떤 영화를 좋아한다고 했을 때, 감독 때문에 보는 건지, 배우 때문에 보는 건지 이런 것들을 더 세분화할 수 있어서 쓰이는 것 같다. 

 

 

1) 추천시스템 강의 - github.com/choco9966/Recommendation-Tutorial?fbclid=IwAR3f4mKzU0c9pSouLAl4sHwOuiOqk9HVBKllJza6I_V44lQOh1Q1UhbKwwM

choco9966/Recommendation-Tutorial

Contribute to choco9966/Recommendation-Tutorial development by creating an account on GitHub.

github.com

 


3.4. Tabular data 논문

 

이 분야 논문은 그때그때 찾아보는 쪽에 가까워서 주기적으로 찾아보는 링크는 없지만, 

주로 현업에서 일할 때 tabular data를 다루는 일이 많아서 정리해둔다.

 

tabular data를 다룰 경우 주로 task는 

1) 상황 분석 2) 미래 예측 으로 나눠지는 것 같다.

 

상황 분석 같은 경우는, 어떤 현상이 일어날 때 그 현상이 왜 일어났는지 분석하는 쪽인데, 

그래서 예측력이 좋은 복잡한 모델보다는, 설명력이 높은 모델들을 주로 쓴다.

decision tree나 linear/logistic regression, k-means clustering을 주로 쓰는 것 같다.

아니면 모델을 안 쓰고 단순 통계적 분석도 많이 쓰이는데, t-test, ANOVA, 상관분석 등도 많이 쓴다.

 

미래 예측 같은 경우는, 상황 분석이 끝나고 미래 예측까지 해보자 했을 때 주로 진행되는데, 

이때 쓰는 모델은 몇 개로 정해져 있는 것 같지는 않지만,

complex 모델을 써도 모델에 대해 설명해야하는 경우가 많아서

주로 모델을 만들고 explainer를 붙이는 경우가 많은 것 같다. 

즉, randomforest로 어떤 모델을 만들었다면, LIME 같은 explainer를 만들어서 모델이 어떤 변수, 구간에서 그러한 선택을 한 건지 추출한다. 

 

굉장히 많은 competition이 tabular data에 대해서 열리는데, 

모델은 xgboost나 lightgbm으로 종결되는 것 같다.

하지만 알고리즘을 어떻게 짜느냐,

feature enginnering을 어떻게 하느냐,

결측치가 있는 경우는 전처리를 어떻게 하냐에 따라 성능이 천차만별로 갈리는데, 

tabular data 쪽은 그만큼 feature enginnering이나 null handling이 중요한 것 같다.

요일 컬럼으로부터 isHoliday 컬럼을 만든다든지, EDA나 통계적 기법을 통해서 중요한 feature들을 많이 만들고,

또 안정성을 확보하기 위해서 feature를 만들고 VIF 등을 써서 feature selection 작업을 거친다.

 

null handing이나 outlier handling도 중요한데, 빈 값이 많은 경우 여기서도 성능 차이가 갈린다.

근데 이 부분은 딱히 방법이 없는 것 같다. 그냥 계속 EDA를 하면서 규칙을 찾아서 넣는 수밖에 없는 것 같지만, 

최근에 새로운 기법을 알게 됐는데 일단 lightgbm에 다 때려넣고 null이 있을 경우 random_seed를 특정 방향으로 잡아주고 fine-tuning으로 해결하는 방법도 있는 듯하다.

 

아무튼 tabular dataset을 다룰 때 주로 마주하는 이슈는,  

1) null data handling / outlier handling 

2) feature enginnering

3) evaluation metric (특히, imbalanced class 일 경우)

4) model algorithm (이진 분류를 먼저 하고 regression을 할지, dnn 등 여러 모델과 ensemble할지 등)

이렇게 4가지였던 것 같다.

 

대개 evaluation metric은 풀어야 하는 비즈니스 문제에 따라 정해지는 경우들이 많아서 

100% 타임라인에서 90%는 1), 2)에 대한 일들을 하면서 보내고, 남은 5~10%는 4)의 일을 하는 것 같다.

 

저 4가지 이슈들에 대한 논문들은 정말 많은데 차차 정리해야겠다.

 


4. 기업의 AI 논문

 

1) 카카오브레인 논문 - www.kakaobrain.com/publication

카카오브레인

인간처럼 생각하고, 행동하는 지능을 통해 인류가 이제까지 풀지 못했던 난제에 도전합니다.

www.kakaobrain.com

 

2) SKT 브레인 논문 - www.skt.ai/index.do

SK Telecom AI Center

T-Brain, as a pioneer in the field of AI research, performs a pivotal role within AIC. We self-define the issues around AI and to solve these, research scientists and engineers across different expertise, from deep learning algorithm and techniques to sign

www.skt.ai

 

3) 네이버 클로바 논문 - clova-ai.blog/publication-list/

Publication List

Visit the post for more.

clova-ai.blog

 


5. 논문은 아니지만 유용한 기술 블로그

 

 

단비 | NC 공식 블로그

 

blog.ncsoft.com

NCSOFT DANBI

 

danbi-ncsoft.github.io

Blog - LINE ENGINEERING

#diagram #documentation #Technical writing

engineering.linecorp.com

카카오엔터프라이즈 기술블로그 Tech&(테크앤)

카카오엔터프라이즈의 기술블로그, Tech&(테크앤)입니다.

tech.kakaoenterprise.com

쿠팡 기술블로그 — Coupang Technology Blog – Medium

쿠팡 기술블로그 입니다. 쿠팡의 기술을 통한 혁신 스토리와 개발자 문화를 공유합니다.

medium.com

Airbnb Engineering & Data Science – Medium

Creative engineers and data scientists building a world where you can belong anywhere. http://airbnb.io.

medium.com

Netflix TechBlog

Learn about Netflix’s world class engineering efforts, company culture, product developments and more.

netflixtechblog.com

 

티스토리라서 그런가.. 네이버 d2 url이 추가 안 된다.

naver d2 d2.naver.com/home도 공부할 때 좋은 자료가 많은 것 같다.

 


머신러닝, 딥러닝을 공부하는 학생입니다.

잘못된 부분이나, 추가할 부분이 있다면 자유롭게 댓글 남겨주세요.


인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

List of Articles
번호 분류 제목 조회 수 날짜
공지 일반 프롬프트 쉽게 검색하는 방법 file 116 2024.12.13
공지 이미지 사진 분석 A·I 모델 사용방법 file 154 2024.10.21
공지 인공지능 기본 A·I 모델 사용방법 file 177 2024.10.21
» 일반 AI 인공지능 논문 사이트 모음 file 770 2024.04.08
HOT글 일반 gpt vs 제미나이, 구글이 아무리 잘만들어도 선택은 gpt 2 file 584 2025.05.09
공지 사랑LOVE 포인트 만렙! 도전 4613 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25843 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20425 2025.01.21
194 프롬프트 힐링 카페음악 만드는 프롬프트 2089 2024.11.20
193 프롬프트 화난 표정 프롬프트 질문? 1 1512 2024.11.20
192 일반 혼자가 좋은 사람 특징 7개 2355 2024.11.02
191 일반 현재 chat GPT-5 개발 근황 2 file 819 2025.03.25
190 일반 한국시리즈 우승팀 중에, 정규시즌 1위가 아니었던 팀이 몇년도 어느팀이었지? 103 2024.10.21
189 일반 하늘 화폭에 그림 그리는 10여류화가 576 2025.05.09
188 일반 프롬프트 암호화 하고 출력물도 암호화하는 것 가능할까? 62 2023.04.25
187 일반 프롬프트 쉽게 검색하는 방법 file 116 2024.12.13
186 일반 프롬포트 질문 1 32 2024.08.10
185 일반 퍼플렉시티도 딥리서치를 출시했네요 file 595 2025.05.09
184 일반 퍼플렉시티 1년 이용권 공짜로 받기 file 576 2025.05.09
183 일반 튜링상 수상자가 말하는 국가 간 AI 경쟁 상황은? 얀 르쿤 박사 인터뷰 file 308 2025.05.18
182 일반 텍스트와 사진부터 역동적인 비디오까지, AIVideoGenerator.me를 사용하면 쉽게 제작할 수 있습니다! 589 2025.05.09
181 AI 서비스 텍스트 한 줄이면 물리엔진 뚝딱 #shorts file 5307 2025.01.10
180 일반 챗gpt 활용해 누구나 웹툰 포스터 1분이면 제작 가능한 시대 957 2025.03.29
179 일반 챗gpt 이미지 생성 후 무료 동영상 만들 수 있는 클링ai 소개합니다. file 545 2025.04.09
178 일반 챗gpt 이미지 생성 활용해서 사진 하츄핑 레고 캐릭터로 만들 수 있네요^^ 622 2025.04.02
177 일반 챗GPT 신기하넹 1095 2025.04.18
176 그림/사진 쩍벌 발차기 선보이는 AI file 192 2024.07.08
175 프롬프트 질문 NAIA 랜덤 프롬프트 질문 2 1580 2024.11.20
174 일반 지브리 애니메이션 속 주인공이 되고 싶다면? ‘Ghibli AI Image Generator’ 정식 출시 file 608 2025.05.09
173 일반 중국,일본,이란,러시아가 동맹국으로 한국,일본,미국,유럽권 이렇게 양쪽에서 전쟁으로 싸운다면 어느쪽이 우세해? 그리고 전쟁 이후의 피해 상황을 예상해줘. 한국에 미치는 경제적인 영향도 92 2024.10.21
172 일반 중국 스타트업이 공개한 ai 에이전트 file 6290 2025.03.11
171 젠장.. 이제는 암호로 후기 남기기는 힘들어지겠군..ㅋ file 43 2024.09.18
170 정규표현식 생성해주는 사이트 file 634 2024.03.14
169 일반 전세계 난리난 AI 답변..jpg file 585 2025.05.09
168 AI 서비스 저작권 없는 AI 음악 만들기 사이트 프로그램 10개 5265 2024.11.16
167 AI 서비스 저작권 걱정 없이 무료로 PPT, 템플릿, 섬네일, 포스터 등을 만들 수 있는 웹 기반 그래픽 툴 미리캔버스 MiriCanvas file 436 2024.01.12
166 일반 인텔, 차세대 고급 칩 패키징 요구 사항을 위한 유리 기판 개발 file 1159 2023.10.27
165 일반 인터넷에서 스트리밍 비디오를 다운로드하는 원리가 뭐야? ffmpeg라는게 자주 쓰이던데 141 2024.10.21
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7