Pickle模塊的使用

更新時間:2018-11-26 來源:黑馬程序員瀏覽量:

　　1.Pickle的介紹

　　pickle是python語言的一個標準模塊，安裝python后已包含pickle庫，不需要單獨再安裝

　　序列化和反序列化作用

　　1.便于存儲。序列化過程將文本信息轉變?yōu)槎M制數(shù)據(jù)流。這樣就信息就容易存儲在硬盤之中，當需要讀取文件的時候，從硬盤中讀取數(shù)據(jù)，然后再將其反序列化便可以得到原始的數(shù)據(jù)。在Python程序運行中得到了一些字符串、列表、字典等數(shù)據(jù)，想要長久的保存下來，方便以后使用，而不是簡單的放入內(nèi)存中關機斷電就丟失數(shù)據(jù)。python模塊大全中的Pickle模塊就派上用場了，它可以將對象轉換為一種可以傳輸或存儲的格式。

　　2.便于傳輸。當兩個進程在進行遠程通信時，彼此可以發(fā)送各種類型的數(shù)據(jù)。無論是何種類型的數(shù)據(jù)，都會以二進制序列的形式在網(wǎng)絡上傳送。發(fā)送方需要把這個對象轉換為字節(jié)序列，在能在網(wǎng)絡上傳輸;接收方則需要把字節(jié)序列在恢復為對象。

　　pickle模塊是以二進制的形式序列化后保存到文件中(保存文件的后綴為”.pkl”)，不能直接打開進行預覽。而python的另一個序列化標準模塊json，則是human-readable的，可以直接打開查看(例如在notepad++中查看)。

　　pickle模塊有兩類主要的接口，即序列化和反序列化。

　　其中序列化操作包括：

　　pickle.dump()

　　Pickler(file, protocol).dump(obj)

　　反序列化操作包括：

　　pickle.load()

　　Unpickler(file).load()

　　2 序列化操作

　　2.1 序列化方法pickle.dump()

　　序列化的方法為 pickle.dump()，該方法的相關參數(shù)如下：

　　pickle.dump(obj, file, protocol=None,*,fix_imports=True)

　　該方法實現(xiàn)的是將序列化后的對象obj以二進制形式寫入文件file中，進行保存。它的功能等同于 Pickler(file, protocol).dump(obj)。

　　關于參數(shù)file，有一點需要注意，必須是以二進制的形式進行操作(寫入)。

　　參考前文的案例如下：

　　import picklewith open('svm_model_iris.pkl', 'wb') as f:

　　pickle.dump(svm_classifier, f)

　　file為'svm_model_iris.pkl'，并且以二進制的形式('wb')寫入。

　　關于參數(shù)protocol，一共有5中不同的類型，即(0,1,2,3,4)。(0,1,2)對應的是python早期的版本，(3,4)則是在python3之后的版本。

　　此外，參數(shù)可選 pickle.HIGHEST_PROTOCOL和pickle.DEFAULT_PROTOCOL。當前，python3.5版本中，pickle.HIGHEST_PROTOCOL的值為4，pickle.DEFAULT_PROTOCOL的值為3。當protocol參數(shù)為負數(shù)時，表示選擇的參數(shù)是pickle.HIGHEST_PROTOCOL。

　　2.2 序列化方法pickle.dumps()

　　pickle.dumps()方法的參數(shù)如下：

　　pickle.dumps(obj, protocol=None,*,fix_imports=True)

　　pickle.dumps()方法跟pickle.dump()方法的區(qū)別在于，pickle.dumps()方法不需要寫入文件中，它是直接返回一個序列化的bytes對象。

　　2.3 序列化方法Pickler(file, protocol).dump(obj)

　　pickle模塊提供了序列化的面向對象的類方法，即 class pickle.Pickler(file, protocol=None,*,fix_imports=True),Pickler類有dump()方法。

　　Pickler(file, protocol).dump(obj) 實現(xiàn)的功能跟 pickle.dump() 是一樣的。

　　關于Pickler類的其他method，請參考官方API。

　　3 反序列化操作

　　3.1 反序列化方法pickle.load()

　　序列化的方法為 pickle.load()，該方法的相關參數(shù)如下：

　　pickle.load(file, *,fix_imports=True, encoding=”ASCII”. errors=”strict”)