完美世界国际版下载,玄幻小说排行榜完本,懒人听书

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

讓Python更加充分的使用Sqlite3

我最近在涉及大量數(shù)據(jù)處理的項(xiàng)目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數(shù)據(jù)庫，所有的數(shù)據(jù)都將保存在內(nèi)存中，包括字典查找、迭代和條件等查詢。這很好，但可以放入內(nèi)存的只有那么多，并且將數(shù)據(jù)從磁盤重新生成或加載到內(nèi)存是一個繁瑣又耗時的過程。

創(chuàng)新互聯(lián)建站于2013年開始，是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司，擁有項(xiàng)目成都網(wǎng)站制作、網(wǎng)站設(shè)計網(wǎng)站策劃，項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個夢想脫穎而出為使命，1280元源匯做網(wǎng)站,已為上家服務(wù),為源匯各地企業(yè)和個人服務(wù),聯(lián)系電話:18982081108

我決定試一試sqlite3。因?yàn)橹恍璐蜷_與數(shù)據(jù)庫的連接，這樣可以增加可處理的數(shù)據(jù)量，并將應(yīng)用程序的加載時間減少到零。此外，我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關(guān)于這次經(jīng)歷的心得和發(fā)現(xiàn)。

TL;DR

使用大量操作 (又名 executemany)。
你不需要使用光標(biāo) (大部分時間)。
光標(biāo)可被迭代。
使用上下文管理器。
使用編譯指示 (當(dāng)它有意義)。
推遲索引創(chuàng)建。
使用占位符來插入 python 值。

1. 使用大量操作

如果你需要在數(shù)據(jù)庫中一次性插入很多行，那么你真不應(yīng)該使用 execute。sqlite3 模塊提供了批量插入的方式：executemany。

而不是像這樣做：

 
 
 
   
  
  
  for row in iter_data():    
  
  
  connection.execute('INSERT INTO my_table VALUES (?)', row)

你可以利用這個事實(shí)，即 executemany 接受元組的生成器作為參數(shù)：

 
 
 
   
  
  
  connection.executemany(   
  
  
      'INSERT INTO my_table VALUE (?)',   
  
  
      iter_data()   
  
  
  )

這不僅更簡潔，而且更高效。實(shí)際上，sqlite3 在幕后利用 executemany 實(shí)現(xiàn) execute，但后者插入一行而不是多行。

我寫了一個小的基準(zhǔn)測試，將一百萬行插入空表(數(shù)據(jù)庫在內(nèi)存中)：

executemany: 1.6 秒
execute: 2.7 秒

2. 你不需要游標(biāo)

一開始我經(jīng)常搞混的事情就是，光標(biāo)管理。在線示例和文檔中通常如下：

 
 
 
   
  
  
  connection = sqlite3.connect(':memory:')   
  
  
  cursor = connection.cursor()   
  
  
  # Do something with cursor

但大多數(shù)情況下，你根本不需要光標(biāo)，你可以直接使用連接對象。

像 execute

 
 
 
   
  
  
  executemany

類似的操作可以直接在連接上調(diào)用。以下是一個證明此事的示例：

 
 
 
   
  
  
  import sqlite3   
  
  
     
  
  
  connection = sqlite3(':memory:')   
  
  
     
  
  
  # Create a table   
  
  
  connection.execute('CREATE TABLE events(ts, msg)')   
  
  
     
  
  
  # Insert values   
  
  
  connection.executemany(   
  
  
      'INSERT INTO events VALUES (?,?)',   
  
  
      [   
  
  
          (1, 'foo'),   
  
  
          (2, 'bar'),   
  
  
          (3, 'baz')   
  
  
      ]   
  
  
  )   
  
  
     
  
  
  # Print inserted rows   
  
  
  for row in connnection.execute('SELECT * FROM events'):   
  
  
      print(row)

3. 光標(biāo)(Cursor)可被用于迭代

你可能經(jīng)常會看到使用fetchone或fetchall來處理 SELECT 查詢結(jié)果的示例。但是我發(fā)現(xiàn)處理這些結(jié)果的最自然的方式是直接在光標(biāo)上迭代：

 
 
 
   
  
  
  for row in connection.execute('SELECT * FROM events'):   
  
  
      print(row)

這樣一來，只要你得到足夠的結(jié)果，你就可以終止查詢，并且不會引起資源浪費(fèi)。當(dāng)然，如果事先知道你需要多少結(jié)果，可以改用 LIMIT SQL語句，但Python生成器是非常方便的，可以讓你將數(shù)據(jù)生成與數(shù)據(jù)消耗分離。

4. 使用Context Managers(上下文管理器)

即使在處理SQL事務(wù)的中間，也會發(fā)生討厭的事情。為了避免手動處理回滾或提交，你可以簡單地使用連接對象作為上下文管理器。在以下示例中，我們創(chuàng)建了一個表，并錯誤地插入了重復(fù)的值：

 
 
 
   
  
  
  import sqlite3   
  
  
  connection = sqlite3.connect(':memory:')   
  
  
     
  
  
  with connection:   
  
  
      connection.execute(   
  
  
          'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))')   
  
  
     
  
  
  try:   
  
  
      with connection:   
  
  
          connection.executemany('INSERT INTO events VALUES (?, ?)', [   
  
  
              (1, 'foo'),   
  
  
              (2, 'bar'),   
  
  
              (3, 'baz'),   
  
  
              (1, 'foo'),   
  
  
          ])   
  
  
  except (sqlite3.OperationalError, sqlite3.IntegrityError) as e:   
  
  
      print('Could not complete operation:', e)   
  
  
         
  
  
  # No row was inserted because transaction failed   
  
  
  for row in connection.execute('SELECT * FROM events'):   
  
  
      print(row)   
  
  
         
  
  
  connection.close()

5. 使用Pragmas

…當(dāng)它真的有用時

在你的程序中有幾個 pragma 可用于調(diào)整 sqlite3 的行為。特別地，其中一個可以改善性能的是 synchronous ：

 
 
 
   
  
  
  connection.execute('PRAGMA synchronous = OFF')

你應(yīng)該知道這可能是危險的。如果應(yīng)用程序在事務(wù)中間意外崩潰，數(shù)據(jù)庫可能會處于不一致的狀態(tài)。所以請小心使用! 但是如果你要更快地插入很多行，那么這可能是一個選擇。

6. 推遲索引創(chuàng)建

假設(shè)你需要在數(shù)據(jù)庫上創(chuàng)建幾個索引，而你需要在插入很多行的同時創(chuàng)建索引。把索引的創(chuàng)建推遲到所有行的插入之后可以導(dǎo)致實(shí)質(zhì)性的性能改善。

7. 使用占位符插入 Python 值

使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全，而 sqlite3 給你提供了更好的方法來做到這一點(diǎn)：

 
 
 
   
  
  
  # Do not do this!   
  
  
  my_timestamp = 1   
  
  
  c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp)   
  
  
     
  
  
  # Do this instead   
  
  
  my_timestamp = (1,)   
  
  
  c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)

此外，使用Python%s(或格式或格式的字符串常量)的字符串插值對于 executemany 來說并不是總是可行。所以在此嘗試沒有什么真正意義!

請記住，這些小技巧可能會(也可能不會)給你帶來好處，具體取決于特定的用例。你應(yīng)該永遠(yuǎn)自己去嘗試，決定是否值得這么做。

分享標(biāo)題：讓Python更加充分的使用Sqlite3
網(wǎng)站鏈接：http://fisionsoft.com.cn/article/ccdjipe.html

新聞中心

其他資訊