說聲謝謝!給你需要的NumPy知識
Python雖然是一門比較好入門的語言,相較于其他語言來說是一門比較簡單的語言。不過有一個很重要的問題就是,即使Python 語言的很多方法不用手打都已經被封裝,可以Python初學者還是要學習很多東西。下面我結合了一些經常用到的NumPy基礎知識送給大家。
基礎知識
NumPy 主要的運算對象為同質的多維數組,即由同一類型元素(一般是數字)組成的表格,且所有元素通過正整數元組進行索引。在 NumPy 中,維度 (dimension) 也被稱之為軸線(axes)。
比如坐標點 [1, 2, 1] 有一個軸線。這個軸上有 3 個點,所以我們說它的長度(length)為 3。而如下數組(array)有 2 個軸線,長度同樣為 3。
[[ 1., 0., 0.],
[ 0., 1., 2.]]
NumPy 的數組類(array class)叫做 ndarray,同時我們也常稱其為數組(array)。注意 numpy.array 和標準 Python 庫中的類 array.array 是不同的。標準 Python 庫中的類 array.array 只處理一維的數組,提供少量的功能。ndarray 還具有如下很多重要的屬性:
ndarray.ndim:顯示數組的軸線數量(或維度)。
ndarray.shape:顯示在每個維度里數組的大小。如 n 行 m 列的矩陣,它的 shape 就是(n,m)。
>>> b = np.array([[1,2,3],[4,5,6]])
>>> b.shape
(2, 3)
ndarray.size:數組中所有元素的總量,相當于數組的 shape 中所有元素的乘積,例如矩陣的元素總量為行與列的乘積。
>>> b = np.array([[1,2,3],[4,5,6]])
>>> b.size
6
ndarray.dtype:顯示數組元素的類型。Python 中的標準 type 函數同樣可以用于顯示數組類型,NumPy 有它自己的類型如:numpy.int32, numpy.int16, 和 umpy.float64,其中「int」和「float」代表數據的種類是整數還是浮點數,「32」和「16」代表這個數組的字節數(存儲大小)。
ndarray.itemsize:數組中每個元素的字節存儲大小。例如元素類型為 float64 的數組,其 itemsize 為 8(=64/8)。
>>> import numpy as np
>>> a = np.arange(15).reshape(3, 5)
>>> a
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
>>> a.shape
(3, 5)
>>> a.ndim
2
>>> a.dtype.name
int64
>>> a.itemsize
8
>>> a.size
15
>>> type(a)
<type numpy.ndarray >
>>> b = np.array([6, 7, 8])
>>> b
array([6, 7, 8])
>>> type(b)
<type numpy.ndarray >
創建數組
NumPy 有很多種創建數組的方法。比如,你可以用 Python 的列表(list)來創建 NumPy 數組,其中生成的數組元素類型與原序列相同。
>>> import numpy as np
>>> a = np.array([2,3,4])
>>> a
array([2, 3, 4])
>>> a.dtype
dtype( int64 )
>>> b = np.array([1.2, 3.5, 5.1])
>>> b.dtype
dtype( float64 )
一個常見的誤差(error)在于調用 array 時使用了多個數值參數,而正確的方法應該是用「[]」來定義一個列表的數值而作為數組的一個參數。
>>> a = np.array(1,2,3,4) # WRONG
>>> a = np.array([1,2,3,4]) # RIGHT
array 將序列中的序列轉換為二維的數組,序列中的序列中的序列轉換為三維數組,以此類推。
>>> b = np.array([(1.5,2,3), (4,5,6)])
>>> b
array([[ 1.5, 2. , 3. ],
[ 4. , 5. , 6. ]])
數組的類型也可以在創建時指定清楚:
>>> b = np.array([(1.5,2,3), (4,5,6)])
>>> c = np.array( [ [1,2], [3,4] ], dtype=complex )
>>> c
array([[ 1.+0.j, 2.+0.j],
[ 3.+0.j, 4.+0.j]])
一般數組的內部元素初始是未知的,但它的大小是已知的。因此,NumPy 提供了一些函數可以創建有初始數值的占位符數組,這樣可以減少不必要的數組增長及運算成本。
函數 zeros 可創建一個內部元素全是 0 的數組,函數 ones 可創建一個內部元素全是 1 的數組,函數 empty 可創建一個初始元素為隨機數的數組,具體隨機量取決于內存狀態。默認狀態下,創建數組的數據類型(dtype)一般是 float64。
>>> np.zeros( (3,4) )
array([[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.]])
>>> np.ones( (2,3,4), dtype=np.int16 ) # dtype can also be specified
array([[[ 1, 1, 1, 1],
[ 1, 1, 1, 1],
[ 1, 1, 1, 1]],
[[ 1, 1, 1, 1],
[ 1, 1, 1, 1],
[ 1, 1, 1, 1]]], dtype=int16)
>>> np.empty( (2,3) ) # uninitialized, output may vary
array([[ 3.73603959e-262, 6.02658058e-154, 6.55490914e-260],
[ 5.30498948e-313, 3.14673309e-307, 1.00000000e+000]])
為了創建數列,NumPy 提供一個與 range 類似的函數來創建數組:arange。
>>> np.arange( 10, 30, 5 )
array([10, 15, 20, 25])
>>> np.arange( 0, 2, 0.3 ) # it accepts float arguments
array([ 0. , 0.3, 0.6, 0.9, 1.2, 1.5, 1.8])
當 arange 使用浮點型參數時,因為浮點精度的有限性,arange 不能判斷有需要創建的數組多少個元素。在這種情況下,換成 linspace 函數可以更好地確定區間內到底需要產生多少個數組元素。
>>> from numpy import pi
>>> np.linspace( 0, 2, 9 ) # 9 numbers from 0 to 2
array([ 0. , 0.25, 0.5 , 0.75, 1. , 1.25, 1.5 , 1.75, 2. ])
>>> x = np.linspace( 0, 2*pi, 100 ) # useful to evaluate function at lots of points
>>> f = np.sin(x)
array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, numpy.random.rand, numpy.random.randn, fromfunction, fromfile (這些函數也可以創建數組,有時間可以嘗試解釋)
輸出數組
當你輸出一個數組時,NumPy 顯示這個數組的方式和嵌套列表是相似的。但將數組打印到屏幕需要遵守以下布局:
最后一個軸由左至右打印
倒數第二個軸為從上到下打印
其余的軸都是從上到下打印,且每一塊之間都通過一個空行分隔
如下所示,一維數組輸出為一行、二維為矩陣、三維為矩陣列表。
>>> a = np.arange(6) # 1d array
>>> print(a)
[0 1 2 3 4 5]
>>>
>>> b = np.arange(12).reshape(4,3) # 2d array
>>> print(b)
[[ 0 1 2]
[ 3 4 5]
[ 6 7 8]
[ 9 10 11]]
>>>
>>> c = np.arange(24).reshape(2,3,4) # 3d array
>>> print(c)
[[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]]
上述使用的 reshape 函數可指定數組的行列數,并將所有元素按指定的維度數排列,詳細介紹請看后面章節。在數組的打印中,如果一個數組所含元素數太大,NumPy 會自動跳過數組的中間部分,只輸出兩邊。
>>> print(np.arange(10000))
[ 0 1 2 ..., 9997 9998 9999]
>>>
>>> print(np.arange(10000).reshape(100,100))
[[ 0 1 2 ..., 97 98 99]
[ 100 101 102 ..., 197 198 199]
[ 200 201 202 ..., 297 298 299]
...,
[9700 9701 9702 ..., 9797 9798 9799]
[9800 9801 9802 ..., 9897 9898 9899]
[9900 9901 9902 ..., 9997 9998 9999]]
如果想要 NumPy 輸出整個數組,你可以用 set_printoptions 改變輸出設置。
>> np.set_printoptions(threshold=np.nan)
好啦!今天的分享到這里就結束了,希望大家持續關注馬哥教育官網,每天都會有大量優質內容與大家分享!
版權聲明:轉載文章來自公開網絡,版權歸作者本人所有,推送文章除非無法確認,我們都會注明作者和來源。如果出處有誤或侵犯到原作者權益,請與我們聯系刪除或授權事宜。