013 图的实现

邻接矩阵(adjacency matrix)

有向图

假设有5个城市,名字依次叫做ABCDE。

vertex = ['A', 'B', 'C', 'D', 'E']  
  
adjacency_matrix = [  
    [0, 1, 0, 0, 0],  
    [1, 0, 0, 0, 1],  
    [0, 1, 0, 1, 0],  
    [0, 1, 1, 0, 0],  
    [0, 0, 0, 1, 0],  
]

adjacency_matrix[i][j] 表示从i到j是否具有有向边。

有向边的含义:

  • adjacency_matrix[2][1] 等于 1, 表明从C可以到达B。
  • adjacency_matrix[1][2] 等于 0, 表明从B不能到达C。
  • adjacency_matrix[4][3] 等于 1, 表明从E可以到达D。
  • adjacency_matrix[3][0] 等于 0, 表明从D不能到达A。

在这个例子中,每一个城市到达自己这里,好像说不过去,没有什么意义,索性让正对角线为0。

无向图

注意,如果这个图是无向的,那么邻接矩阵是对称矩阵,类似这样:

adjacency_matrix = [
    [0, 1, 0, 0, 1],
    [1, 0, 1, 1, 0],
    [0, 1, 0, 1, 1], 
    [0, 1, 1, 0, 0],
    [1, 0, 1, 0, 0]
]

带权(网)

如果ABCDE这5个城市之间修起了公路,想通过边的权重来代表两个城市之间的公路距离是多少千米。

带权的形式是这样的:

vertex = ['A', 'B', 'C', 'D', 'E']  

adjacency_matrix = [
    [0, 72, 0, 0, 23],
    [72, 0, 94, 61, 0],
    [0, 94, 0, 19, 59],
    [0, 61, 19, 0, 0],
    [23, 0, 59, 0, 0]  
]

在这里,A到B的公路距离是72km, B到C的公路距离是94km, B到D的公路距离是61km, A到E的公路距离是23km。

带多维权重信息(容器)

假设后来在公路的基础上,又修建了铁路,开辟了飞机航线。乘坐不同的交通工具会花不同的时间,假设单位为分钟数。

况且每个地方地势不一样,去的时候和回来的时候所花的时间也不一样。

可以通过一个类来表示多种形式的权。或者,元组或命名元组,dataclass类也可以。

这里使用dataclass可能更方便。

from dataclasses import dataclass

vertex = ['A', 'B', 'C', 'D', 'E']


@dataclass
class E:
    driving_time: int
    train_time: int
    flying_time: int


adjacency_matrix = [
    [E(0, 0, 0), E(4320, 1200, 60), E(0, 0, 0), E(0, 0, 0), E(1800, 600, 48)],
    [E(3600, 900, 54), E(0, 0, 0), E(4800, 1500, 60), E(3000, 1080, 36), E(0, 0, 0)],
    [E(0, 0, 0), E(5400, 1800, 66), E(0, 0, 0), E(2400, 720, 30), E(4200, 1320, 54)],
    [E(0, 0, 0), E(4200, 1500, 48), E(2100, 600, 24), E(0, 0, 0), E(0, 0, 0)],
    [E(1200, 480, 36), E(0, 0, 0), E(3900, 960, 42), E(0, 0, 0), E(0, 0, 0)]
]

E 数据类是Edge边的缩写,表示图中的一条边,存储了多种交通方式的时间权重,其中:

  • driving_time 表示开车时间
  • train_time 表示乘坐火车时间
  • flying_time 表示乘坐飞机时间

adjacency_matrix 中每个元素是一个 E 的实例,比如:

  • E(4320, 1200, 60) 表示从城市 A 到城市 B 的开车时间是4320分钟,乘火车1200分钟,乘飞机60分钟
  • E(0, 0, 0) 表示城市之间这一方向没有连接

邻接表(adjacency list)

有向图

前面有向图的例子,转换成邻接表是这样:

vertex = {  
  'A': ['B'],  
  'B': ['A', 'E'],  
  'C': ['B', 'D'],  
  'D': ['B', 'C'],  
  'E': ['D'],  
}

这里的ABCDE是字符串,实际上,可以是任意Python类型,但是用作字典键时,必须是可哈希的(hash)。

这里,'C': ['B', 'D'] 的意思是C可以到达B和D,也即存在这样一条有向边。

无向图

与邻接矩阵类似,如果图是无向图,A和B之间有边,那么需要保证A中有B,B中有A。就像这样:

vertex = {  
  'A': ['B'],  
  'B': ['A'],  
}

带权图(网)

带权的形式只需用一个元组来包裹即可。这里也可以使用命名元组等方式,都可以。

# 加权邻接表
vertex = {
  'A': [(B, 10)],
  'B': [(A, 10), (C, 20)],
  'C': [(B, 20), (D, 15)],
  'D': [(B, 15), (C, 15)],
  'E': [(D, 9)], 
}

至于带多维权重等,可以通过新建一个类、命名元组等方式来实现。它的实现原理是相似的,不多赘述。

这里补充一下,如果可以保证ABCDE对象是可哈希的(hash),那么可以用作字典键,像这样:

vertex = {
  A: [(B, 10)],
  B: [(A, 10), (C, 20)],
  C: [(B, 20), (D, 15)],
  D: [(B, 15), (C, 15)],
  E: [(D, 9)], 
}

也就是直接使用对象的“引用”,不需要转换为字符串。

邻接表是重点

邻接矩阵的优点是简单、容易表示权重、检查两个顶点之间是否有边更快、更容易实现某些图算法等。

但实际生活当中,我们用得更多的是邻接表。因为:

  • 对于存储稀疏数据来说,邻接矩阵并不高效。而现实生活中大多数情况都是比较稀疏的,邻接表就比较适合。
  • 邻接表的很多操作的时间复杂度会更低
  • 邻接表在程序中的操作更加灵活一些
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容