pyppeteer是puppeteer的Python版本,puppeteer是谷歌基于node.js開(kāi)發(fā)的一個(gè)工具,它可以使我們通過(guò)JavaScript來(lái)控制Chrome執(zhí)行一些操作,功能非常強(qiáng)大,下面簡(jiǎn)單跟大家講解一下pyppeteer的安裝使用。
pyppeteer代碼如下:
import asyncio
from pyppeteer import launch
from lxml import etree
async def main():
browser = await launch()
page = await browser.newPage()
await page.goto('https://movie.douban.com/chart')
await page.waitForXPath('//table//a[@title]')
doc = etree.HTML(await page.content())
names = [element.attrib['title'] for element in doc.xpath('//table//a[@title]')]
print('Names: ', names)
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
運(yùn)行結(jié)果如下:
Names:['想哭的我?guī)蟻?lái)貓的面具','午夜0時(shí)的吻','侵入者','默片解說(shuō)員']
代碼的大致意思了懂點(diǎn)程序的這里應(yīng)該都看得懂,我就不多說(shuō)了。通過(guò)上面的這個(gè)示例,我們看到pyppeteer比selenium要簡(jiǎn)潔的多,而且環(huán)境配置也方便,直接自動(dòng)幫我們實(shí)現(xiàn)了環(huán)境配置。本來(lái)還有一些詳細(xì)的講解,由于篇幅長(zhǎng)度限制,本篇先簡(jiǎn)單介紹下基礎(chǔ)的,后面再跟大家分享下其它的功能。