Python SciPy 教程:是什么、库、函数和示例

Python 中的 SciPy

Python 中的 SciPy 是一个开源库,用于解决数学、科学、工程和技术问题。它允许用户通过一系列高级 Python 命令来操作和可视化数据。SciPy 是在 Python NumPy 扩展的基础上构建的。SciPy 也发音为“Sigh Pi”。

SciPy 的子包

为什么使用 SciPy

  • SciPy 包含各种子包,有助于解决科学计算中最常见的问题。
  • Python 中的 SciPy 包是除 C/C++ 的 GNU Scientific Library 或 Matlab 之外最常用的科学库。
  • 易于使用和理解,并且计算能力强。
  • 它可以操作 NumPy 库的数组。

NumPy vs SciPy

NumPy

  • NumPy 使用 C 编写,用于数学或数值计算。
  • 它比其他 Python 库更快
  • NumPy 是数据科学执行基本计算的最有用的库。
  • NumPy 仅包含数组数据类型,它执行最基本的操作,如排序、整形、索引等。

SciPy

  • SciPy 构建于 NumPy 之上
  • Python 中的 SciPy 模块是功能齐全的线性代数版本,而 NumPy 只包含一些功能。
  • 许多新的数据科学功能在 SciPy 中可用,而不是 NumPy。

SciPy – 安装和环境设置

您还可以通过 pip 在 Windows 中安装 SciPy

Python3 -m pip install --user numpy scipy 

在 Linux 上安装 Scipy

sudo apt-get install  python-scipy python-numpy

在 Mac 上安装 SciPy

sudo port install py35-scipy py35-numpy

在我们开始学习 SciPy Python 之前,您需要了解 NumPy 的基本功能和不同类型的数组。

导入 SciPy 模块和 Numpy 的标准方法

from scipy import special   #same for other modules
import numpy as np

文件输入/输出包

Scipy 的 I/O 包提供了广泛的函数来处理不同的文件格式,如 Matlab、Arff、Wave、Matrix Market、IDL、NetCDF、TXT、CSV 和二进制格式。

我们来看一个在 MatLab 中经常使用的 Python SciPy 文件格式示例。

 import numpy as np
 from scipy import io as sio
 array = np.ones((4, 4))
 sio.savemat('example.mat', {'ar': array}) 
 data = sio.loadmat(‘example.mat', struct_as_record=True)
 data['ar']

输出

array([[ 1., 1., 1., 1.],
           [ 1., 1., 1., 1.],
           [ 1., 1., 1., 1.],
           [ 1., 1., 1., 1.]])

代码解释

  • 第 1 和第 2 行: 使用 I/O 包和 Numpy 导入必要的 SciPy 库。
  • 第 3 行: 创建一个 4x4 的二维全 1 数组。
  • 第 4 行: 将数组保存在 example.mat 文件中。
  • 第 5 行:example.mat 文件获取数据。
  • 第 6 行: 打印输出。

特殊函数包

  • scipy.special 包包含大量的数学物理函数。
  • SciPy 的特殊函数包括立方根、指数、对数指数和、Lambert、排列组合、Gamma、Bessel、超几何、Kelvin、beta、抛物柱面、相对误差指数等。
  • 要获得这些函数的一行描述,请在 Python 控制台中输入:
help(scipy.special)	
Output:
NAME
    scipy.special

DESCRIPTION
    ========================================
    Special functions (:mod:`scipy.special`)
    ========================================
     
    .. module:: scipy.special
     
    Nearly all of the functions below are universal functions and follow
    broadcasting and automatic array-looping rules. Exceptions are noted.

立方根函数

立方根函数计算值的立方根。

语法

scipy.special.cbrt(x)

示例

from scipy.special import cbrt
#Find cubic root of 27 & 64 using cbrt() function
cb = cbrt([27, 64])
#print value of cb
print(cb)

输出: array([3., 4.])

指数函数

指数函数计算每个元素的 10**x。

示例

from scipy.special import exp10
#define exp10 function and pass value in its
exp = exp10([1,10])
print(exp)

输出: [1.e+01 1.e+10]

排列与组合

SciPy 还提供了计算排列和组合的功能。

组合 – scipy.special.comb(N,k)

示例

from scipy.special import comb
#find combinations of 5, 2 values using comb(N, k)
com = comb(5, 2, exact = False, repetition=True)
print(com)

输出 15.0

排列 –

scipy.special.perm(N,k)

示例

from scipy.special import perm
#find permutation of 5, 2 using perm (N, k) function
per = perm(5, 2, exact = True)
print(per)

输出 20

对数指数和函数

Log Sum Exponential 计算输入元素指数和的对数。

语法

scipy.special.logsumexp(x) 

Bessel 函数

N 阶整数阶计算函数

语法

scipy.special.jn()

SciPy 线性代数

  • SciPy 的线性代数是 BLAS 和 ATLAS LAPACK 库的实现。
  • 线性代数的性能比 BLAS 和 LAPACK 快得多。
  • 线性代数例程接受二维数组对象,输出也是二维数组。

现在让我们用 scipy.linalg 进行一些测试,

计算二维矩阵的行列式

from scipy import linalg
import numpy as np
#define square matrix
two_d_array = np.array([ [4,5], [3,2] ])
#pass values to det() function
linalg.det( two_d_array )

输出 -7.0

逆矩阵 –

scipy.linalg.inv()

SciPy 的逆矩阵计算任何方阵的逆。

让我们看看,

from scipy import linalg
import numpy as np
# define square matrix
two_d_array = np.array([ [4,5], [3,2] ])
#pass value to function inv()
linalg.inv( two_d_array )

输出

array( [[-0.28571429,  0.71428571],
       [ 0.42857143, -0.57142857]] )

特征值和特征向量

scipy.linalg.eig()

  • 线性代数中最常见的问题是特征值和特征向量,可以使用 eig() 函数轻松解决。
  • 现在我们来找出二维方阵 (X) 的特征值及其对应的特征向量。

示例

from scipy import linalg
import numpy as np
#define two dimensional array
arr = np.array([[5,4],[6,3]])
#pass value into function
eg_val, eg_vect = linalg.eig(arr)
#get eigenvalues
print(eg_val)
#get eigenvectors
print(eg_vect)

输出

[ 9.+0.j -1.+0.j] #eigenvalues
 [ [ 0.70710678 -0.5547002 ] #eigenvectors
   [ 0.70710678  0.83205029] ]

离散傅里叶变换 – scipy.fftpack

  • DFT 是一种数学技术,用于将空间数据转换为频率数据。
  • FFT(快速傅里叶变换)是计算 DFT 的算法。
  • FFT 应用于多维数组。
  • 频率定义了一个特定时间段内的信号或波长数量。

示例: 以 Matplotlib 库为例,展示一个波形。我们以 sin(20 × 2πt) 为例,这是一个简单的周期函数。

%matplotlib inline
from matplotlib import pyplot as plt
import numpy as np 

#Frequency in terms of Hertz
fre  = 5 
#Sample rate
fre_samp = 50
t = np.linspace(0, 2, 2 * fre_samp, endpoint = False )
a = np.sin(fre  * 2 * np.pi * t)
figure, axis = plt.subplots()
axis.plot(t, a)
axis.set_xlabel ('Time (s)')
axis.set_ylabel ('Signal amplitude')
plt.show()

输出

Discrete Fourier Transform

您可以看到,频率为 5 Hz,其信号在 1/5 秒内重复——这称为特定时间周期。

现在让我们利用 DFT 应用来使用这个正弦波。

from scipy import fftpack

A = fftpack.fft(a)
frequency = fftpack.fftfreq(len(a)) * fre_samp
figure, axis = plt.subplots()

axis.stem(frequency, np.abs(A))
axis.set_xlabel('Frequency in Hz')
axis.set_ylabel('Frequency Spectrum Magnitude')
axis.set_xlim(-fre_samp / 2, fre_samp/ 2)
axis.set_ylim(-5, 110)
plt.show()

输出

Discrete Fourier Transform

  • 您可以清楚地看到输出是一个一维数组。
  • 输入中的复数值在两个点之外均为零。
  • 在 DFT 示例中,我们可视化了信号的幅度。

SciPy 中的优化与拟合 – scipy.optimize

  • 优化提供了用于曲线拟合、多维或标量以及根拟合最小化的有用算法。
  • 让我们以标量函数为例,来寻找最小标量函数。
%matplotlib inline
import matplotlib.pyplot as plt
from scipy import optimize
import numpy as np

def function(a):
       return   a*2 + 20 * np.sin(a)
plt.plot(a, function(a))
plt.show()
#use BFGS algorithm for optimization
optimize.fmin_bfgs(function, 0) 

输出

Optimization and Fit in SciPy

优化成功终止。

当前函数值:-23.241676

迭代次数:4

函数评估次数:18

梯度评估次数:6

array([-1.67096375])

  • 在此示例中,优化是通过从初始点使用梯度下降算法完成的。
  • 但是可能存在的问题是局部最小值而不是全局最小值。如果我们找不到全局最小值的邻域,那么我们需要应用全局优化,并使用 basinhopping() 作为全局最小化函数,它结合了局部优化器。

optimize.basinhopping(function, 0)

输出

fun: -23.241676238045315
 lowest_optimization_result:
      fun: -23.241676238045315
 hess_inv: array([[0.05023331]])
      jac: array([4.76837158e-07])
  message: 'Optimization terminated successfully.'
     nfev: 15
      nit: 3
     njev: 5
   status: 0
  success: True
        x: array([-1.67096375])
                    message: ['requested number of basinhopping iterations completed successfully']
      minimization_failures: 0
                       nfev: 1530
                        nit: 100
                       njev: 510
               x: array([-1.67096375])

Nelder-Mead 算法

  • Nelder-Mead 算法通过 method 参数进行选择。
  • 对于行为良好的函数,它提供了最直接的最小化方法。
  • Nelder-Mead 算法不用于梯度评估,因为它可能需要更长的时间来找到解决方案。
import numpy as np
from scipy.optimize import minimize
#define function f(x)
def f(x):   
    return .4*(1 - x[0])**2
  
optimize.minimize(f, [2, -1], method="Nelder-Mead")

输出

final_simplex: (array([[ 1.        , -1.27109375],
       [ 1.        , -1.27118835],
       [ 1.        , -1.27113762]]), array([0., 0., 0.]))
           fun: 0.0
       message: 'Optimization terminated successfully.'
          nfev: 147
           nit: 69
        status: 0
       success: True
             x: array([ 1.        , -1.27109375])

SciPy 图像处理 – scipy.ndimage

  • scipy.ndimage 是 SciPy 的一个子模块,主要用于执行图像相关操作。
  • ndimage 意为“n”维图像。
  • SciPy 图像处理提供几何变换(旋转、裁剪、翻转)、图像滤波(锐化和去噪)、显示图像、图像分割、分类和特征提取。
  • SciPy 中的MISC 包包含预建图像,可用于执行图像操作任务。

示例: 让我们以图像的几何变换为例。

from scipy import misc
from matplotlib import pyplot as plt
import numpy as np
#get face image of panda from misc package
panda = misc.face()
#plot or show image of face
plt.imshow( panda )
plt.show()

输出

Image Processing with SciPy

现在我们垂直翻转当前图像。

#Flip Down using scipy misc.face image  
flip_down = np.flipud(misc.face())
plt.imshow(flip_down)
plt.show()

输出

Image Processing with SciPy

示例: 使用 Scipy 旋转图像,

from scipy import ndimage, misc
from matplotlib import pyplot as plt
panda = misc.face()
#rotatation function of scipy for image – image rotated 135 degree
panda_rotate = ndimage.rotate(panda, 135)
plt.imshow(panda_rotate)
plt.show()

输出

Image Processing with SciPy

SciPy 集成 – 数值积分

  • 当我们在无法进行解析积分的函数上进行积分时,我们需要转向数值积分。
  • SciPy 提供了使用数值积分功能来积分函数。
  • scipy.integrate 库提供单重积分、重积分、三重积分、多重积分、高斯积分、Romberg、梯形和辛普森规则。

示例: 现在以单重积分为例。

Integration with Scipy

这里 a 是上限,b 是下限。

from scipy import integrate
# take f(x) function as f
f = lambda x : x**2
#single integration with a = 0 & b = 1  
integration = integrate.quad(f, 0 , 1)
print(integration)

输出

(0.33333333333333337, 3.700743415417189e-15)

这里函数返回两个值,第一个值是积分值,第二个值是积分的估计误差。

示例:现在以 SciPy 的双重积分为例。我们计算以下方程的双重积分,

Integration with Scipy

from scipy import integrate
import numpy as np
#import square root function from math lib
from math import sqrt
# set  fuction f(x)
f = lambda x, y : 64 *x*y
# lower limit of second integral
p = lambda x : 0
# upper limit of first integral
q = lambda y : sqrt(1 - 2*y**2)
# perform double integration
integration = integrate.dblquad(f , 0 , 2/4,  p, q)
print(integration)

输出

(3.0, 9.657432734515774e-14)

您可以看到上面的输出与之前的输出相同。

摘要

  • SciPy(发音为“Sigh Pi”)是一个开源的 Python 库,用于数学、科学计算、工程和技术计算。
  • SciPy 包含各种子包,有助于解决科学计算中最常见的问题。
  • SciPy 构建于 NumPy 之上
包名 描述
scipy.io 文件输入/输出
scipy.special 特殊函数
scipy.linalg 线性代数运算
scipy.interpolate 插值
scipy.optimize 优化和拟合
scipy.stats 统计和随机数
scipy.integrate 数值积分
scipy.fftpack 快速傅里叶变换
scipy.signal 信号处理
scipy.ndimage 图像处理 –