欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

Python爬蟲之?dāng)?shù)據(jù)解析模塊bs4基礎(chǔ)

介紹:

創(chuàng)新互聯(lián)專業(yè)為企業(yè)提供西安網(wǎng)站建設(shè)、西安做網(wǎng)站、西安網(wǎng)站設(shè)計(jì)、西安網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)與制作、西安企業(yè)網(wǎng)站模板建站服務(wù),10年西安做網(wǎng)站經(jīng)驗(yàn),不只是建網(wǎng)站,更提供有價(jià)值的思路和整體網(wǎng)絡(luò)服務(wù)。

最近在學(xué)Python爬蟲,在這里對(duì)數(shù)據(jù)解析模塊bs4做個(gè)學(xué)習(xí)筆記。

用途:

bs4用于解析xml文檔,而html只是xml的一種

bs4 官方文檔地址:

https://www.crummy.com/software/BeautifulSoup/bs4/doc/

學(xué)習(xí)筆記:

from bs4 import BeautifulSoup

html_doc = """

<html><head><title>The Dormouse's story</title></head>

<body>

<p class="title"><b>The Dormouse's story</b></p>

<p class="story">Once upon a time there were three little sisters; and their names were

<a class=... ... ... ... ... ... "sister" id="link1">Elsie</a>,

<a class="sister" id="link2">Lacie</a> and

<a class="sister" id="link3">Tillie</a>;

and they lived at the bottom of a well.</p>

<p class="story">...</p>

"""

soup = BeautifulSoup(html_doc,'html.parser')? ? #創(chuàng)建一個(gè)BeautifulSoup對(duì)象,添加html文件解析器,在不同平臺(tái)可能不同,在Linux上就不需要

print(soup.prettify())? ? #美化輸出

print(soup.get_text())? ??#將html_doc變量中保存的全部?jī)?nèi)容輸出(Linux系統(tǒng)會(huì)以\n隔開)

print('')

print(type(soup.title))

print(dir(soup.title))

print(soup.title)? ? #獲取html標(biāo)題

????<title>The Dormouse's story</title>

print(soup.title.text)? ? #獲取html標(biāo)題內(nèi)容

????"The Dormouse's story"

print(soup.a)? ? ? ?#獲取a標(biāo)簽(第一個(gè))

????<a class="sister" id="link1">Elsie</a>

print(soup.a.attrs)? ?#獲取第一個(gè)a標(biāo)簽的所有屬性,組成一個(gè)字典

????{'href': 'http://example.com/elsie', 'class': ['sister'], 'id': 'link1'}

print(soup.a.attrs['href'])? ? #獲取第一個(gè)a標(biāo)簽的href屬性

????'http://example.com/elsie'

print(soup.a.has_attr('class'))? ? ?#判斷class屬性是否存在

????True

print(soup.p)? ? #獲取p標(biāo)簽(第一個(gè))

????<p class="title"><b>The Dormouse's story</b></p>

print(soup.p.children)? ? #獲取第一個(gè)p標(biāo)簽下的所有子節(jié)點(diǎn)

????<list_iterator object at 0x7fe8185261d0>

print(list(soup.p.children))

????[<b>The Dormouse's story</b>]

print(list(soup.p.children)[0])

????<b>The Dormouse's story</b>

print(list(soup.p.children)[0].text)

????"The Dormouse's story"

print(soup.find_all('a'))? ? #獲取所有的a標(biāo)簽

????[<a class="sister" id="link1">Elsie</a>, <a class="sister" id=a class="sister" id="link3">Tillie</a>]

for a in soup.find_all('a'):? ?#遍歷所有的a標(biāo)簽

? ? print(a.attrs['href'])

print(soup.find(id='link3'))? ? #獲取id=link3的標(biāo)簽

????<a class="sister" id="link3">Tillie</a>

print('#'*150)

#支持CSS選擇器

#查找類名為story的節(jié)點(diǎn)

print(soup.select('.story'))

print('')

print(soup.select('.story a'))

print('')

#查找id=link1的節(jié)點(diǎn)

print(soup.select('#link1'))

網(wǎng)站標(biāo)題:Python爬蟲之?dāng)?shù)據(jù)解析模塊bs4基礎(chǔ)
本文網(wǎng)址:http://www.aaarwkj.com/article42/gjggec.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供營(yíng)銷型網(wǎng)站建設(shè)、商城網(wǎng)站網(wǎng)站改版、App開發(fā)、搜索引擎優(yōu)化網(wǎng)站收錄

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

手機(jī)網(wǎng)站建設(shè)
亚洲熟妇av一区二区三区| 最近最新免费成人在线视频| 国产女主播在线观看视频| 色婷婷国产精品高潮呻吟| 国产婷婷综合一区二区| 蜜桃av噜噜一区二区三| 丝袜美腿蜜汁一龙二凤| 中文字幕一区二区三区不卡日日| 国产精品黄色av一区二区| 超碰国产熟女一区二区三区| 亚洲欧美丝袜清纯另类| 国产91日韩欧美在线观看| 国产级一片内射视步页| 欧美成人精品欧美一级黄片| 亚洲限制级电影一区二区| 国产精品毛片在线看不卡| 久久精品国产亚洲av麻豆尤物| 国产丝袜美女一区二区| 亚洲国产成人av精品精品国产自 | 毛片精品一区二区二区三区 | 日本黄色大波少妇网站| 日本高清免费观看一区| 色偷偷91综合久久噜噜| 日本午夜福利免费在线播放| 成人av高清在线观看| 未满十八在线观看网址| 亚洲一区二区精品免费视频| 91中文字幕精品一区二区| 婷婷激情亚洲综合综合久久| 亚洲国产精品午夜福利在线播放| 日麻批视频在线免费观看| 毛片精品一区二区二区三区| 天天免费日日夜夜夜夜| av天堂五月在线观看| 久久 久久国内精品亚洲| 亚洲福利视频在线观看免费 | 欧美日韩亚洲一区二区搜索| 亚洲一区在线观看蜜臀| 麻豆国产国语精品三级在线观看| 91最新精品丝袜国产在线| 欧美丰满人妻少妇视频在线|