新聞中心
這里有您想知道的互聯網營銷解決方案
創(chuàng)新互聯Python教程:如何使用python實現文本數據挖掘?
剛拿到這個問題,大部分小伙伴一定會感覺到無所下手,數據挖掘內容那么多,要從哪個位置開始入手,于是小編,也去試了試,先給自己定了個大的框架,于是一步一步把這個過程走出來,接著就幫大家呈現以下內容,不知道的小伙伴可以來了解下啦`

常見的文本挖掘有以下方式:
1、讀取txt數據
In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
2、讀取csv數據
csv文本文件是非常常用的一種數據存儲格式,而且其存儲量要比Excel電子表格大很多,下面我們就來看看如何利用Python讀取csv格式的數據文件:
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv
3、讀取電子表格文件
這里所說的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數據都是存放在Excel電子表格中的,如果我們需要使用Python對其進行分析或處理的話,第一步就是如何讀取Excel數據。下面我們來看看如果讀取Excel數據集:
In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8')
In [8]: mydata_excel
4、讀取數據庫數據
MySQLdb模塊是一個連接Python與MySQL的中間橋梁,但目前只能在Python2.x中運行,但不意味著Python3就無法連接MySQL數據庫。這里向大家介紹一個非常靈活而強大的模塊,那就是pymysql模塊。我比較喜歡他的原因是,該模塊可以偽裝成MySQLdb模塊,具體看下面的例子:
In [1]: import pymysql In [2]: pymysql.install_as_MySQLdb() #偽裝為MySQLdb模塊 In [3]: import MySQLdb使用Connection函數聯通Python與MySQL In [4]: conn = MySQLdb.Connection( ...: host = 'localhost', ...: user = 'root', ...: password = 'snake', ...: port = 3306, ...: database = 'test', ...: charset='gbk')使用conn的游標方法(cursor),目的是為接下來的數據庫操作做鋪墊。 In [5]: cursor = conn.cursor() In [6]: sql = 'select * from memberinfo'執(zhí)行SQL語句 In [7]: cursor.execute(sql)Out[7]: 4 In [8]: data = cursor.fetchall() In [9]: data
好啦,以上就是常見的文本挖掘方式啦,大家可以試試哈~
文章題目:創(chuàng)新互聯Python教程:如何使用python實現文本數據挖掘?
轉載注明:http://fisionsoft.com.cn/article/cooehpo.html


咨詢
建站咨詢
