한국어를 받아쓰기 할 땐 무조건 네이버다. 클로바노트만큼 한국어를 잘 인식하는 경우는 없다. 그래서 나는 모든 작업을 할때 (chatgpt로 요약, 영상 자막 추가 등) 꼭 오디오를 추출해서 클로바 노트를 이용하는 과정을 거친다.

귀찮아서 그때그때 구글에 youtube audio download 로 검색해서 나오는 웹에서 했었는데, 계속 반복되는 작업이다보니 로컬에서 직접 실행시켜보기로 했다.

이 모든 과정은 10분 만에 끝났다.

1. Coding

Untitled

요즘 langchain에 빠져있어서 추후에 오디오 추출한 걸 가지고 더 자동화 시스템을 만들 수 있지않을까 생각했지만, chatgpt는 langchain이란 말을 가뿐히 무시하고 그냥 코드를 만들어주었다.

Untitled

상세하게 코드 로직까지 설명해주고, 다운로드 받아야하는 패키지까지 설명해준다. sweet gpt..

from pytube import YouTube

def download_youtube_audio(url, output_path):
    yt = YouTube(url)
    # YouTube 영상의 제목을 가져옵니다.
    title = yt.title
    # 오디오 스트림 중 최고 품질의 스트림을 선택합니다.
    audio_stream = yt.streams.filter(only_audio=True).first()
    # 오디오 파일을 지정된 경로에 저장합니다.
    audio_stream.download(output_path, filename=title + ".mp3")

# 사용 예제
url = "여기에 YouTube 동영상 URL을 입력하세요"
output_path = "여기에 저장할 경로를 입력하세요"
download_youtube_audio(url, output_path)

완성되어버렸다.

사실 난 대부분 자바스크립트로 웹쪽만 해와서 파이썬은 헷갈릴때가 많다. 그래서 파이썬으로 작업할땐 구글 검색창과 늘 함께 해왔는데, 그럴 필요없이 1분만에 끝나버렸다.

Untitled

실행하는 커맨드를 수행할때 유튜브 url을 넣어주고싶어서, 이렇게 요청했다.