저번 글의 꽤 바쁠 것 같다는 말이 현실이 되었다.
최근에 너무 바빠서 블로그 글을 올리지 못했다.
매일같이 작업을 했고 티스토리에 글을 올려야 한다는 생각을 오늘이 되어서야 하게 되었다.
해커톤 팀매칭이 완료되었고, 우리 팀은 미국 언론 파악 서비스를 만들기로 했다.
많은 사람들이 이번 한일 경제 전쟁에서 중요한 역할을 하던 미국 오피니언 리더들의 의견을 보다 빠르게 알고 싶었다. 하지만 일반 사람들 입장에선 한국 언론에서 소개해 주는 미국 언론의 내용만 알 수 있었고 그 내용도 제한적이었다.
이 프로그램을 통해 일반 사람들도 한국 언론이 소개해 주는 제한적인 미국 언론 내용에서 벗어나 더 정확하고 빠르게 관심 사건에 대한 미국 반응을 알 수 있도록 이러한 프로그램을 만들기로 했다.
프로젝트 진행 과정은 이러하다.
1. 미국 주요 언론사들의 기사를 일정 주기마다 크롤링.
2. 한국 관심 사건 관련 기사만을 스크래핑.
3. 스크랩한 데이터를 다듬고, Google API를 이용해 번역.
4. 데이터를 사이트에 띄워서 쉽게 관심 사건에 대한 미국 기사를 볼 수 있도록 함.
5. 자연어 처리를 통해 Data Science의 일정 연구 부분을 구현하고, 기사의 긍정 부정 논조를 파악.
6. 언어적인 문제가 해결이 된다면 전 세계 언론을 대상으로도 작동이 가능하도록 하며 지속적으로 성능을 향상시키며 체계적인 버전 관리를 위해 문서화에 힘쓴다.
밑의 링크를 참고하면 현재 진행중인 프로젝트의 구체적인 진행 과정을 알 수 있다.
당분간은 글 작성이 어려울 것 같다!
https://github.com/Hacanna42/scrapingarticles
Hacanna42/scrapingarticles
for hackathon. Contribute to Hacanna42/scrapingarticles development by creating an account on GitHub.
github.com
'IT 관련 활동' 카테고리의 다른 글
한국코드페어 해커톤 대회 결과 (0) | 2019.11.08 |
---|---|
해커톤 팀 '슬래시슬립' 진행상황! 2 (0) | 2019.09.26 |
SW빌더스 챌린지 해커톤 팀매칭 시작! (0) | 2019.08.23 |
앱 KPI 실적 (0) | 2019.08.20 |
NYPC 대회 종료! (0) | 2019.08.20 |