新聞中心
前兩天,在網(wǎng)上看到一個(gè)有意思的問(wèn)題:彩票預(yù)測(cè)靠譜么?為什么還有那么多的人相信彩票預(yù)測(cè)?

創(chuàng)新互聯(lián)公司公司2013年成立,先為茅箭等服務(wù)建站,茅箭等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為茅箭企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。
暫且不說(shuō),彩票預(yù)測(cè)是否靠譜?彩票預(yù)測(cè)也分人而異,江湖上騙術(shù)很多,有些甚至?xí)`以為彩票預(yù)測(cè)的準(zhǔn)確度可以很高,這些操盤(pán)手法,讓不知原理的彩民心甘情愿地掏錢(qián)買(mǎi)料。
在彩票預(yù)測(cè)上,也有正兒八經(jīng)去研究“規(guī)律” 的,不外乎三個(gè)“派別”:數(shù)據(jù)派、圖形派、公式派。還有一派不列入:字謎字畫(huà)派,可納入蛇精病行列。
究竟哪一派預(yù)測(cè)的靠譜準(zhǔn)確呢?不懂,因?yàn)槲規(guī)缀醪毁I(mǎi)彩票(買(mǎi)也是玩玩,娛樂(lè)娛樂(lè)),也不去研究。但不管哪一派總得有數(shù)據(jù)可研究,今天我只負(fù)責(zé)幫大家如何獲取3D彩票自創(chuàng)辦以來(lái),所有的數(shù)據(jù)(中獎(jiǎng)號(hào)碼、中獎(jiǎng)注數(shù)、銷(xiāo)售額以及返獎(jiǎng)比例等)
在爬取一些簡(jiǎn)單的(沒(méi)有反爬機(jī)制的)靜態(tài)網(wǎng)頁(yè)時(shí),一般采取的策略是:選中目標(biāo)(所謂的url鏈接),觀察結(jié)構(gòu)(鏈接結(jié)構(gòu),網(wǎng)頁(yè)結(jié)構(gòu)),構(gòu)思動(dòng)手(選用什么HTML下載器,解析器等)。在爬蟲(chóng)過(guò)程中,都會(huì)涉及到三種利器:
HTML下載器:下載HTML網(wǎng)頁(yè)
HTML解析器:解析出有效數(shù)據(jù)
數(shù)據(jù)存儲(chǔ)器:將有效數(shù)據(jù)通過(guò)文件或者數(shù)據(jù)庫(kù)的形式存儲(chǔ)起來(lái)
今天,我們將利用requests庫(kù)和BeautifulSoup模塊來(lái)抓取中彩網(wǎng)頁(yè)福彩3D相關(guān)的信息,并將其保存到Excel表格中。
在開(kāi)始前,先分析看看目標(biāo)網(wǎng)頁(yè)的結(jié)構(gòu):
可以發(fā)現(xiàn),目標(biāo)網(wǎng)頁(yè)的URL
http://kaijiang.zhcw.com/zhcw/html/3d/list_2.html,
每次變化一處:list_x后面的數(shù)字,其代表第幾頁(yè)。
然后,觀察其網(wǎng)頁(yè)結(jié)構(gòu),也很簡(jiǎn)單,可以看到一期的彩票信息對(duì)應(yīng)的源代碼是一個(gè)tr節(jié)點(diǎn),我們可以用BeautifulSoup庫(kù)來(lái)提取這里面的一些信息。
整體思路是:若要獲取福彩3D創(chuàng)辦14年以來(lái)所有的信息(一共246頁(yè)),只需要分開(kāi)請(qǐng)求246次,這樣獲取不同的頁(yè)面之后,再利用BeautifulSoup庫(kù)提取到相關(guān)信息,利用xlrd庫(kù)將數(shù)據(jù)寫(xiě)入Excel中,就可以獲取到福彩3D所有的信息,結(jié)果如下圖:
(一共將近5000條數(shù)據(jù))
詳情代碼如下:
- import requests
- from bs4 import BeautifulSoup
- import xlwt
- import time
- #獲取第一頁(yè)的內(nèi)容
- def get_one_page(url):
- headers = {
- 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
- }
- response = requests.get(url,headers=headers)
- if response.status_code == 200:
- return response.text
- return None
- #解析第一頁(yè)內(nèi)容,數(shù)據(jù)結(jié)構(gòu)化
- def parse_one_page(html):
- soup = BeautifulSoup(html,'lxml')
- i = 0
- for item in soup.select('tr')[2:-1]:
- yield{
- 'time':item.select('td')[i].text,
- 'issue':item.select('td')[i+1].text,
- 'digits':item.select('td em')[0].text,
- 'ten_digits':item.select('td em')[1].text,
- 'hundred_digits':item.select('td em')[2].text,
- 'single_selection':item.select('td')[i+3].text,
- 'group_selection_3':item.select('td')[i+4].text,
- 'group_selection_6':item.select('td')[i+5].text,
- 'sales':item.select('td')[i+6].text,
- 'return_rates':item.select('td')[i+7].text
- }
- #將數(shù)據(jù)寫(xiě)入Excel表格中
- def write_to_excel():
- f = xlwt.Workbook()
- sheet1 = f.add_sheet('3D',cell_overwrite_ok=True)
- row0 = ["開(kāi)獎(jiǎng)日期","期號(hào)","個(gè)位數(shù)","十位數(shù)","百位數(shù)","單數(shù)","組選3","組選6","銷(xiāo)售額","返獎(jiǎng)比例"]
- #寫(xiě)入第一行
- for j in range(0,len(row0)):
- sheet1.write(0,j,row0[j])
- #依次爬取每一頁(yè)內(nèi)容的每一期信息,并將其依次寫(xiě)入Excel
- i=0
- for k in range(1,247):
- url = 'http://kaijiang.zhcw.com/zhcw/html/3d/list_%s.html' %(str(k))
- html = get_one_page(url)
- print('正在保存第%d頁(yè)。'%k)
- #寫(xiě)入每一期的信息
- for item in parse_one_page(html):
- sheet1.write(i+1,0,item['time'])
- sheet1.write(i+1,1,item['issue'])
- sheet1.write(i+1,2,item['digits'])
- sheet1.write(i+1,3,item['ten_digits'])
- sheet1.write(i+1,4,item['hundred_digits'])
- sheet1.write(i+1,5,item['single_selection'])
- sheet1.write(i+1,6,item['group_selection_3'])
- sheet1.write(i+1,7,item['group_selection_6'])
- sheet1.write(i+1,8,item['sales'])
- sheet1.write(i+1,9,item['return_rates'])
- i+=1
- f.save('3D.xls')
- def main():
- write_to_excel()
- if __name__ == '__main__':
- main()
到此,關(guān)于14年的福彩3D信息都可以爬取下來(lái),至于如何預(yù)測(cè)?下一期的彩票趨勢(shì)如何?不懂也不會(huì),接下來(lái)是否中獎(jiǎng),就靠你們了。彩民們,我只能幫你們到這了!
最后結(jié)尾,關(guān)于彩票預(yù)測(cè)究竟準(zhǔn)不準(zhǔn)?我不說(shuō)太多的理論分析,我只提出兩個(gè)問(wèn)題:
命題1:以雙色球?yàn)槔?,下一期雙色球號(hào)碼,1,2,3,4,5,6,7 和 3,4,8,11,22,29,7 這兩組號(hào)碼的中獎(jiǎng)概率如何?誰(shuí)高誰(shuí)低還是都一樣?
命題2:第二個(gè)問(wèn)題更簡(jiǎn)單。假設(shè)你已經(jīng)投了9次硬幣,結(jié)果都是正面?,F(xiàn)在你要投第10次,請(qǐng)問(wèn)是正面的概率是多少?
如果你還要問(wèn)我,彩票有規(guī)律可循嗎?在我看來(lái),彩票規(guī)律就是沒(méi)有規(guī)律(不信,你去分析分析14年以來(lái)的所有數(shù)據(jù)),以人類(lèi)的計(jì)算水平,即使有的話也計(jì)算不出來(lái)的。彩票是娛樂(lè),是一個(gè)運(yùn)氣的游戲,一個(gè)人即使在彩票上賺到了錢(qián),運(yùn)氣好,也不代表使用的方法就可以提高彩票中獎(jiǎng)率。任何打著提高中獎(jiǎng)率的期號(hào)進(jìn)行的盈利行為,即使出發(fā)點(diǎn)是善意的,也會(huì)最終走向錯(cuò)誤。
標(biāo)題名稱(chēng):我用Python爬取了14年所有的福彩3D信息,彩民們,只能幫你們到這了
文章位置:http://fisionsoft.com.cn/article/dhejhcj.html


咨詢
建站咨詢
