zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python 爬虫教程之使用 Python 从 YouTube 链接获取频道名称并存储到SQLite数据库中(教程含源码)

2023-09-11 14:18:32 时间

每次我想将新视频添加到数据库中时,我都必须手动输入频道名称,而不是仅仅从视频 URL 本身中提取它(更不用说它区分大小写了)。好吧,这可能不是最好的方法,但到目前为止它对我和我的目的都有效,我将分享它。

我们只需要 BeautifulSoup 和 urllib 来做这个,所以让我们立即导入它:

from bs4 import BeautifulSoup as bs 
from urllib.request import urlopen, Request

现在我们选择一些 YouTube 视频并使用它们打开它:

url_input = "https://www.youtube.com/watch?v=pShj3gtYQik"
url_opener = urlopen(Request(url_input, headers={'User-Agent': 'Mozilla'}))
videoInfo = bs(url_opener, features="html.parser")

我们已经知道如何从上一篇文章中提取标题:

video_title = videoInfo.title.get_text()

现在,如果您查看 YouTube 视频的页面源,您最终会发现如下所示的内容,这就是我们想要访问的内容(在本例中,来自我上面使用的视频 URL):

在这里插入图片描述
所以我们就这样做了ÿ