ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [오늘의 미션] 유튜브 자막 수집기 기능을 개선하세요.
    나도 궁금해서 해봄/루틴 일지 2025. 2. 25. 19:00
    반응형

    개편된 퀘스트 창

     

    서사

    당신은 데이터 관리자로 승진하자마자 오류가 발생했습니다. 하루는 고객으로부터 전달된 오류를 전달했습니다. 특히나 '한국 지역'에서만 발생하고 있는 오류기 때문에 빠르게 대응해야 합니다. 

     

    목표

    유튜브 자막 수집기의 기능을 개선하여 한국 지역에서 생산되는 유튜브 영상의 자막 정보를 성공적으로 수집하고 저장하세요.


     

    일지

    한국인이다보니 자주 보게 되는 영상이 한국어 영상일 수밖에 없다. youtube_transcript_api가 자꾸만 언어 설정 오류를  뱉어내길래 해결을 해봐야 겠다고 생각했다.

     

    youtube_transcript_api의 공식 홈페이지에 접속해서 설명서를 찾아봤다. 한번에 여러개의 Video ID를 이용해서 자막을 가져올 수도 있었고, 언어 설정을 통해 자막을 가져올 수도 있었다. 이렇게 좋은 기능이 많았는데 찾아보질 않았다니 반성한다.

     

    이전에 작성했던 파이썬 코드를 개선하기로 결심했다. 현재는 인자로 Video ID만 전달받았는데 이제는 언어도 전달 받을 수 있도록 추가했다. 모든 것을 다 처리하고 수행을 했었는데 이게 왠걸?! 커맨드 명령창에서 전달되는 값은 명확하게 문자열로 제공되어야 했다. 그래서 Json 형태로 만들어서 문자열을 만들어줘야 했다. n8n에서는 직접적으로 이걸 처리할 수는 있는 방법은 노드를 추가하는 것이었다.

     

    n8n Node 추가

     

     

    API를 통해 전달된 데이터를 문자열로 변경해줬고, python 코드를 수행할 수 있도록 인자로 전달해줬다. 나머지는 기존과 동일했다.

     

    한글로 입력된 결과물

     

    구글 시트에 최종적으로 한글 자막이 들어오는 걸 확인했다. 막상 처리를 해보니 크게 어렵지 않았다. 생각해보면 뭐든 차근 차근 하나씩 해결하다보면 다 해결이 된다.

     

     

    반응형
Designed by Tistory.