영어권 사용자를 위한 쇼핑몰을 만들어 보자. 아마존에서 상품 정보를 끌어와 openAI로 포스팅을 작성하고 자동 게시를 하는 형식이다. 조금 복잡한 부분은 있다. 하지만 자동화를 위한 단계를 거치를 과정으로 생각하고 살펴보자.
1. 아마존 크롤링을 설정
아마존에 접속해 검색어를 입력해 조회한다.
F12 개발자 모드를 통해 상품 구성을 파악한다. 하나의 상품 정보를 모두 포함하고 있는 상위 태그를 찾아 정보를 추출한다. 그래야 클래스명 중복을 최소화해 원하는 결과를 추출할 수 있다.
크롤링을 위한 아마존 헤더 설정하기
주의할 점은 반드시 cookie를 설정해야 한다. cookie 유무만 체크하기 때문에 cookie = {"a": "b"} 이런 식으로 입력을 해도 통과된다. 정확한 정보는 개발자모드에서 애플리케이션 - 쿠키 - csm-hit 값을 설정한다.
2.아마존 상품 크롤링 & AI 글쓰기
상품명, 상품정보, 이미지 등을 추출한다.
3.OpenAI 글쓰기
(1) 일관된 포스트를 위한 샘플을 만든다.
(2) AI에 역할을 부여하고 답을 하게 한다.
4. 워드 프레스 게시하기
워드 프레스 rest API를 호출해 포스팅을 작성한다.
게시물 확인하기
완벽한 자동화란 쉽지 않다. 다양한 예외 케이스가 발생할 수 있기 때문이다. 완벽하다긴 보단 완벽으로 나아가는 과정에 수많은 장애물을 넘어야 한다. 예를 들어 품절로 상품 가격을 제시하지 않아 none type 에러가 발생하기도 하고, 태그 정보가 중복되어 엉뚱한 데이터를 가져올 수도 있다. 이럴 때마다 상황에 맞는 코딩을 해줘야 한다.
그리고 사용자가 검색해 들어오는 포스팅도 보기 좋게 만들어야 한다. HTML코드 혹은 마크업을 이용해 UI틀을 잡아야 한다. AI가 작성한 글도 마치 사람이 쓴 것과 구별할 수 없을 정도가 되어야 한다. 그래야 유용한 정보로 인식해 방문이나 글 조회수가 늘어나지 않겠는가...
결국 디테일의 차이다. 얼마나 꼼꼼하게 정보를 추출하고 가공하고 또 UI를 보기 좋게 만드느냐다. 완벽에 가까운 자동 시스템을 만드는데 수많은 노력이 들어갈 것이다. 하지만 그 이후는 거의 투입되는 공수 없이 보상이 따라오게 될 것이다.
'코드리뷰 > chatGPT(Python)코드' 카테고리의 다른 글
테팔 무선청소기 vs. 디베아 차이슨 무선청소기: 가격 대비 성능 비교 (0) | 2024.04.22 |
---|---|
Top-End Laptops Face-Off: Windows Laptop vs. Jumper Laptop (0) | 2024.04.20 |
Choosing the Best Laptop: HP Newest 14" Ultralight vs. Jumper Laptop (0) | 2024.04.20 |
댓글