新聞中心
在日常使用pandas的過程中,由于我們所分析的數(shù)據(jù)表規(guī)模、格式上的差異,使得同樣的函數(shù)或方法作用在不同數(shù)據(jù)上的效果存在差異。

而pandas有著自己的一套「參數(shù)設(shè)置系統(tǒng)」,可以幫助我們在遇到不同的數(shù)據(jù)時靈活調(diào)節(jié)從而達(dá)到最好的效果,本文就將介紹pandas中常用的參數(shù)設(shè)置方面的知識。
1. 設(shè)置DataFrame最大顯示行數(shù)
pandas設(shè)置參數(shù)中的display.max_rows用于控制打印出的數(shù)據(jù)框的最大顯示行數(shù),我們使用pd.set_option()來有針對的設(shè)置參數(shù),如下面的例子:
圖2
在修改display.max_rows的參數(shù)值之后,我們的數(shù)據(jù)框只會顯示指定行數(shù)的數(shù)據(jù),中間的部分都會以省略號的形式顯示,當(dāng)我們的數(shù)據(jù)框行數(shù)較多,可以加大這個參數(shù)以顯示更多行數(shù)據(jù)。
2. 設(shè)置DataFrame最大顯示列數(shù)
類似display.max_rows,通過修改display.max_columns我們可以調(diào)節(jié)最大顯示的數(shù)據(jù)框列數(shù)(默認(rèn)是20列),這在我們的數(shù)據(jù)框字段較多又想全部查看的時候很有用:
圖3
3. 設(shè)置每列的最大顯示寬度
對于一些單元格內(nèi)容長度較長的數(shù)據(jù)譬如長文本,在查看數(shù)據(jù)框時過長的部分會被簡化為省略號,而通過修改display.max_colwidth參數(shù)我們可以在必要時,使得超長的部分也顯示出來:
圖4
4. 指定小于某個數(shù)的元素顯示為0
通過display.chop_threshold參數(shù)我們在不修改原始數(shù)據(jù)的情況下,指定數(shù)據(jù)框中絕對值小于閾值的數(shù)顯示為0:
圖5
5. 格式化浮點(diǎn)數(shù)
通過display.float_format參數(shù)我們可以設(shè)置浮點(diǎn)數(shù)的顯示格式,譬如這里我們給浮點(diǎn)數(shù)加上¥前綴并設(shè)定保留兩位小數(shù):
圖6
6. 設(shè)置info()方法中非缺失值檢查的行數(shù)上限
針對數(shù)據(jù)框的info()方法可以幫助我們查看數(shù)據(jù)框的一些概覽信息,譬如每一列對應(yīng)的非缺失值個數(shù)。
但默認(rèn)情況下當(dāng)數(shù)據(jù)框行數(shù)大于1690784行時,再查看info()信息,會處于計(jì)算效率的考慮略去缺失值檢查信息。
這時我們可以通過設(shè)置display.max_info_rows參數(shù)來提高這個上限:
圖7
7. 控制小數(shù)打印的精度
控制數(shù)據(jù)框中小數(shù)的顯示精度除了上文提到的方法之外,還可以通過修改display.precision參數(shù)來控制,默認(rèn)是6位小數(shù):
圖8
8. 臨時修改參數(shù)
有些時候我們只希望在某張表上進(jìn)行設(shè)置參數(shù)的修改,不希望影響到之后的其他表的顯示。
這時除了用pd.reset_option()對指定的參數(shù)進(jìn)行復(fù)原之外,我們還可以利用with關(guān)鍵詞配合pd.option_context以臨時的方式將指定的參數(shù)作用在局部范圍內(nèi):
圖9
網(wǎng)站欄目:Pandas這樣來設(shè)置,做數(shù)據(jù)分析舒適百倍
轉(zhuǎn)載源于:http://fisionsoft.com.cn/article/ccocjdp.html


咨詢
建站咨詢
