久久国产乱子伦精品免费M,亚洲一区二区三区91,欧美国产在线视频,国产精品视频久久

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

一直想做一個從爬蟲到數據處理,到API部署,再到小程序展示的一條龍項目,最近抽了些時間,實現了一個關于知乎熱榜的,今天就來分享一下!

由于代碼還沒有完全整理好,今天只給出一個大致的思路和部分代碼,最終的詳細代碼可以關注后續的文章!

數據爬取

首先我們看下需要爬取的知乎熱榜

https://www.zhihu.com/billboard

這個熱榜可以返回50條熱榜數據,而這些數據都是通過頁面的一個 JavaScript 返回的

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

于是我們就可以通過解析這段 JS 代碼來獲取對應數據

url='https://www.zhihu.com/billboard'
headers={"User-Agent":"","Cookie":""}


defget_hot_zhihu():
res=requests.get(url,headers=headers)
content=BeautifulSoup(res.text,"html.parser")
hot_data=content.find('script',id='js-initialData').string
hot_json=json.loads(hot_data)
hot_list=hot_json['initialState']['topstory']['hotList']
returnhot_list

然后我們再點擊一個熱榜,查看下具體的熱榜頁面,我們一直向下下拉頁面,并打開瀏覽器的調試板,就可以看到如下的一個請求

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

該接口返回了一個包含熱榜回答信息的 json 文件,可以通過解析該文件來獲取對應的回答

defget_answer_zhihu(id):
url='https://www.zhihu.com/api/v4/questions/%s/answers?include='%id
headers={"User-Agent":"","Cookie":""}
res=requests.get(url+Config.ZHIHU_QUERY,headers=headers)
data_json=res.json()
answer_info=[]
foriindata_json['data']:
if'paid_info'ini:
continue
answer_info.append({'author':i['author']['name'],'voteup_count':i['voteup_count'],
'comment_count':i['comment_count'],'content':i['content'],
'reward_info':i['reward_info']['reward_member_count']})
returnanswer_info

數據存儲

獲取到數據之后,我們需要存儲到數據庫中,以便于后續使用。因為后面準備使用 Flask 來搭建 API 服務,所以這里存儲數據的過程也基于 Flask 來做,用插件 flask_sqlalchemy。

定義數據結構

我們定義三張表,分別存儲知乎熱榜的詳細列表信息,熱榜的熱度信息和熱榜對應的回答信息

classZhihuDetails(db.Model):
__tablename__='ZhihuDetails'
id=db.Column(db.Integer,primary_key=True)
hot_id=db.Column(db.String(32),unique=True,index=True)
hot_name=db.Column(db.Text)
hot_link=db.Column(db.String(64))
hot_cardid=db.Column(db.String(32))


classZhihuMetrics(db.Model):
__tablename__='ZhihuMetrics'
id=db.Column(db.Integer,primary_key=True)
hot_metrics=db.Column(db.String(64))
hot_cardid=db.Column(db.String(32),index=True)
update_time=db.Column(db.DateTime)


classZhihuContent(db.Model):
__tablename__='ZhihuContent'
id=db.Column(db.Integer,primary_key=True)
answer_id=db.Column(db.Integer,index=True)
author=db.Column(db.String(32),index=True)
voteup_count=db.Column(db.Integer)
comment_count=db.Column(db.Integer)
reward_info=db.Column(db.Integer)
content=db.Column(db.Text)

定時任務

由于我們需要定時查詢熱榜列表和熱榜的熱度值,所以這里需要定時運行相關的任務,使用插件 flask_apscheduler 來做定時任務

我們的定時任務,涉及到了網絡請求和數據入庫的操作,把這部分定時任務代碼單獨拉出來,在 Flask 項目的根目錄下創建一個文件 apschedulerjob.py,由于在運行該文件時,是沒有 Flask app 變量的,所以我們需要手動調用 app_context() 方法來創建 app 上下文

defopera_db():
withscheduler.app.app_context():
...

當然,這里的 scheduler 變量是在 create_app 中初始化過的

fromflask_apschedulerimportAPScheduler

scheduler=APScheduler()


defcreate_app(config_name):
app=Flask(__name__)
app.config.from_object(config[config_name])
config[config_name].init_app(app)
db.init_app(app)
scheduler.init_app(app)
...

接著,我們就可以根據前面的兩個爬蟲函數,來分別入庫數據了

入庫熱榜熱度數據

update_metrics=ZhihuMetrics(hot_metrics=i['target']['metricsArea']['text'],
hot_cardid=i['cardId'],
update_time=datetime.datetime.now())

入庫熱榜列表數據

new_details=ZhihuDetails(hot_id=i['id'],hot_name=i['target']['titleArea']['text'],
hot_link=i['target']['link']['url'],hot_cardid=i['cardId'])

入庫熱榜回答數據

new_content=ZhihuContent(answer_id=answer_id,author=answer['author'],voteup_count=answer['voteup_count'],
comment_count=answer['comment_count'],reward_info=answer['reward_info'],
content=answer['content'])

最后我們就可以在 Flask 的入口程序中啟動定時任務了

importos
fromappimportcreate_app,scheduler


app=create_app(os.getenv('FLASK_CONFIG')or'default')


if__name__=='__main__':
scheduler.start()
app.run(debug=True)

編寫 API

熱榜列表 API

我們首先來做熱榜列表的接口,在數據庫表 ZhihuMetrics 中拿到當天熱榜的最新熱度信息,然后再根據熱榜熱度信息來獲取對應的列表信息,可以總結到如下的一個函數中

defzhihudata():
current_time='%s-%s-%s00:00:00'%(datetime.now().year,datetime.now().month,datetime.now().day,)
zhihumetrics_data=ZhihuMetrics.query.filter(ZhihuMetrics.update_time>current_time).group_by(ZhihuMetrics.hot_cardid).order_by(ZhihuMetrics.update_time).all()
metrics_list=db_opera.db_to_list(zhihumetrics_data)
details_list=[]
fordinmetrics_list:
zhihudetails_data=ZhihuDetails.query.filter_by(hot_cardid=d[1]).first()
details_list.append([zhihudetails_data.hot_name,zhihudetails_data.hot_link,d[0],d[1],d[2]])

returndetails_list

接著定義一個視圖函數返回 json 數據

@api.route('/api/zhihu/hot/')
defzhihu_api_data():
zhihu_data=zhihudata()
data_list=[]
fordatainzhihu_data:
data_dict={'title':data[0],'link':data[1],'metrics':data[2],'hot_id':data[3],'update_time':data[4]}
data_list.append(data_dict)

returnjsonify({'code':0,'content':data_list}),200

熱榜詳情 API

下面再來做熱榜詳情接口,該接口可以返回熱榜熱度走勢信息,為前端畫圖提供數據。

defzhihudetail(hot_id):
zhihumetrics_details=ZhihuMetrics.query.filter_by(hot_cardid=hot_id).order_by(ZhihuMetrics.update_time).all()
Column={'categories':[],'series':[{'name':'熱度走勢','data':[]}]}

foriinzhihumetrics_details:
Column['categories'].append(datetime.strftime(i.update_time,"%Y-%m-%d%H:%M"))
Column['series'][0]['data'].append(int(i.hot_metrics.split()[0]))

returnColumn



@api.route('/api/zhihu/detail/<id>/')
defzhihu_api_detail(id):
zhihu_detail=zhihudetail(id)
returnjsonify({'code':0,'data':zhihu_detail}),200

接入小程序

對于小程序端,我們這里使用了 uni-app 框架,這是一個可以一份代碼多端運行的框架,還是比較不錯的。

創建項目

首先通過 IDE HBuilder 創建一個 uni-app 模板

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

改造項目

我們簡單改造下該模板,首先修改下 index.nvue 文件,把 tabList 修改如下

data(){
return{
tabList:[{
id:"tab01",
name:'知乎熱榜',
newsid:0
},{
id:"tab02",
name:'微博熱榜',
newsid:23
},

我們暫時只保留兩個 tab 頁簽,沒錯后面還要再做微博的熱榜!

接下來打開 news-page.nvue 文件,修改網絡請求地址

uni.request({

url:'http://127.0.0.1:5000/api/zhihu/hot/',
data:'',

把 URL 地址指向我們自己的 API 服務地址

然后再添加我們自己的新聞參數

hot_id:news.hot_id,
metrics:news.metrics,
news_url:news.link

再修改函數 goDetail 如下

goDetail(detail){
if(this.navigateFlag){
return;
}
this.navigateFlag=true;
uni.navigateTo({
url:'/pages/detail/detail-new?query='+encodeURIComponent(JSON.stringify(detail))
});
setTimeout(()=>{
this.navigateFlag=false;
},200)
},

點擊每條熱榜時,就會跳轉到 url 對應的 /pages/detail/detail-new 頁面

引入 uCharts

下面編寫 detail-new.nvue 文件,這里主要用到了 uni-app 的插件 uCharts。這是一個高性能的跨端圖表插件,非常好用。

template 部分

<template>
<viewclass="qiun-columns">
<viewclass="qiun-bg-whiteqiun-title-barqiun-common-mt">
<viewclass="qiun-title-dot-light">柱狀熱力分布</view>
</view>
<viewclass="qiun-charts">
<canvascanvas-id="canvasColumn"id="canvasColumn"class="charts"@touchstart="touchColumn"></canvas>
</view>

<viewclass="qiun-bg-whiteqiun-title-barqiun-common-mt">
<viewclass="qiun-title-dot-light">線性走勢</view>
</view>
<viewclass="qiun-charts">
<canvascanvas-id="canvasLine"id="canvasLine"class="charts"@touchstart="touchColumn"></canvas>
</view>
</view>
</template>

創建兩個 view,分別用于展示柱狀圖和折線圖

再編寫 script 部分

getServerData(){
uni.request({
url:'http://127.0.0.1:5000/api/zhihu/detail/'+this.details.hot_id,
data:{
},
success:function(res){
_self.serverData=res.data.data;
letColumn={categories:[],series:[]};
Column.categories=res.data.data.categories;
Column.series=res.data.data.series;
_self.showColumn("canvasColumn",Column);
_self.showLine("canvasLine",Column);
},
fail:()=>{
_self.tips="網絡錯誤,小程序端請檢查合法域名";
},
});
}

再根據 uCharts 的官方文檔編寫對應的展示圖表函數

showColumn(canvasId,chartData){
canvaColumn=newuCharts({
$this:_self,
canvasId:canvasId,
type:'column',
legend:{show:true},
fontSize:11,
background:'#FFFFFF',
pixelRatio:_self.pixelRatio,
animation:true,
categories:chartData.categories,
series:chartData.series,
enableScroll:true,
xAxis:{
disableGrid:true,
scrollShow:true,
itemCount:4,
},
yAxis:{
//disabled:true
},
dataLabel:true,
width:_self.cWidth*_self.pixelRatio,
height:_self.cHeight*_self.pixelRatio,
extra:{
column:{
type:'group',
width:_self.cWidth*_self.pixelRatio*0.45/chartData.categories.length
}
}
});

}

這樣,我們就完成了基本的項目開發

我們可以到小程序的模擬器來查看效果啦

熱榜列表頁面

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

熱榜詳情頁面

太好玩了,爬蟲、部署API、加小程序,一條龍玩轉知乎熱榜

基本的效果是有了,不過還有很多需要優化的地方,下一次,我會分享出優化后的代碼以及如何把 API 服務部署到云端,同時還是提供出供大家練習的 API,不要錯過哦!

好啦!今天的分享到這里就結束了,希望大家持續關注馬哥教育官網,每天都會有大量優質內容與大家分享!聲明:文章轉載于網絡,版權歸原作者所有,如有侵權請及時聯系!

相關新聞

歷經多年發展,已成為國內好評如潮的Linux云計算運維、SRE、Devops、網絡安全、云原生、Go、Python開發專業人才培訓機構!

    1. 主站蜘蛛池模板: 讷河市| 青龙| 陵川县| 宁远县| 安乡县| 阿尔山市| 革吉县| 汾西县| 通道| 望谟县| 道孚县| 万宁市| 襄樊市| 康乐县| 富锦市| 中卫市| 晴隆县| 阿拉尔市| 龙岩市| 惠州市| 崇左市| 安宁市| 军事| 武川县| 白山市| 墨竹工卡县| 宜州市| 吉林市| 仁寿县| 上蔡县| 五原县| 额敏县| 景洪市| 濉溪县| 昔阳县| 崇仁县| 西贡区| 新巴尔虎左旗| 石屏县| 西充县| 长寿区|