SkyWalking簡介
SkyWalking是一個開源的觀測平臺鸠珠,用于從服務和云原生等基礎設施中收集遗淳、分析变泄、聚合以及可視化數(shù)據(jù)令哟。SkyWalking 提供了一種簡便的方式來清晰地觀測分布式系統(tǒng),甚至可以觀測橫跨不同云的系統(tǒng)妨蛹。SkyWalking 更像是一種現(xiàn)代的應用程序性能監(jiān)控(Application Performance Monitoring屏富,即APM)工具,專為云原生蛙卤,基于容器以及分布式系統(tǒng)而設計
SkyWalking 在邏輯上分為四部分:探針役听、平臺后端、存儲和用戶界面表窘。其架構圖如下:
- 探針:基于不同的來源探針可能是不一樣的,但作用都是收集數(shù)據(jù)甜滨,將數(shù)據(jù)格式化為 SkyWalking 適用的格式乐严。例如在Java中則是做字節(jié)碼植入,無侵入式的收集衣摩,并通過 HTTP 或者 gRPC 方式發(fā)送數(shù)據(jù)到平臺后端
- 平臺后端:是一個支持集群模式運行的后臺昂验,用于數(shù)據(jù)聚合、數(shù)據(jù)分析以及驅動數(shù)據(jù)流從探針到用戶界面的流程艾扮。平臺后端還提供了各種可插拔的能力既琴,如不同來源數(shù)據(jù)(如來自 Zipkin)格式化,不同存儲系統(tǒng)以及集群管理泡嘴。你甚至還可以使用觀測分析語言來進行自定義聚合分析甫恩。
- 存儲:是開放式的,可以選擇一個既有的存儲系統(tǒng)酌予,如 ElasticSearch磺箕、H2 或 MySQL 集群(Sharding-Sphere 管理)奖慌,也可以選擇自己實現(xiàn)一個存儲系統(tǒng)。
- 用戶界面:也就是SkyWalking的可視化界面松靡,UI非常炫酷且強大简僧,同樣它也是可定制以匹配你已存在的后端的
SkyWalking 為觀察和監(jiān)控分布式系統(tǒng)提供了許多不同場景下的解決方案。例如為Java雕欺、C#及Node.js提供語言自動探針岛马,無侵入式的收集。同時也為一些編譯型語言C++屠列、GO等提供了手動打點 SDK(目前還未支持)啦逆。除此之外,還可以使用服務網(wǎng)格基礎探針來收集數(shù)據(jù)脸哀,以幫助了解整個分布式系統(tǒng)蹦浦。
在SkyWalking中也存在服務、服務實例及端點概念撞蜂,因為SkyWalking就是提供了這些概念的觀測能力:
- 服務(Service):表示對請求提供相同行為的一系列或一組工作負載盲镶。在使用打點代理或 SDK 的時候,你可以定義服務的名字蝌诡。如果不定義的話溉贿,SkyWalking 將會使用你在平臺上定義的名字,如 Istio浦旱。
- 服務實例(Service Instance):上述的一組工作負載中的每一個工作負載稱為一個實例宇色。就像 Kubernetes 中的 pods 一樣,服務實例未必就是操作系統(tǒng)上的一個進程颁湖。但當你在使用打點代理的時候宣蠕, 一個服務實例實際就是操作系統(tǒng)上的一個真實進程。
- 端點(Endpoint):對于特定服務所接收的請求路徑甥捺,如 HTTP 的 URI 路徑和 gRPC 服務的類名 + 方法簽名
綜上抢蚀,SkyWalking 優(yōu)勢如下:
- 多種監(jiān)控手段,語言探針和服務網(wǎng)格(Service Mesh)
- 模塊化镰禾,UI皿曲、存儲、集群管理多種機制可選
- 支持告警
- 優(yōu)秀的可視化方案
更多內(nèi)容可以參考官方文檔:
搭建 SkyWalking 服務 - Linux
對SkyWalking有一個大致的了解后吴侦,本小節(jié)我們來在CentOS7上搭建 SkyWalking 服務屋休。首先我們需要獲取到SkyWalking的下載地址,官方下載地址如下:
這里我選擇當前最新的6.6.0版本的二進制包:
復制下載地址到服務器上進行下載并解壓备韧,具體步驟如下:
[root@localhost ~]# cd /usr/local/src
[root@localhost /usr/local/src]# wget http://mirrors.tuna.tsinghua.edu.cn/apache/skywalking/6.6.0/apache-skywalking-apm-6.6.0.tar.gz
[root@localhost /usr/local/src]# mkdir ../skywalking && tar -zxvf apache-skywalking-apm-6.6.0.tar.gz -C ../skywalking --strip-components 1
[root@localhost /usr/local/src]# cd ../skywalking/
[root@localhost /usr/local/skywalking]# ll -rh # 解壓后的目錄文件如下
total 88K
drwxr-xr-x 2 root root 53 Dec 28 18:22 webapp
-rw-rw-r-- 1 1001 1002 2.0K Dec 24 14:10 README.txt
drwxrwxr-x 2 1001 1002 12K Dec 24 14:28 oap-libs
-rwxrwxr-x 1 1001 1002 32K Dec 24 14:10 NOTICE
drwxrwxr-x 3 1001 1002 4.0K Dec 28 18:22 licenses
-rwxrwxr-x 1 1001 1002 29K Dec 24 14:10 LICENSE
drwxr-xr-x 2 root root 221 Dec 28 18:22 config
drwxr-xr-x 2 root root 241 Dec 28 18:22 bin
drwxrwxr-x 8 1001 1002 143 Dec 24 14:21 agent
[root@localhost /usr/local/skywalking]#
運行bin
目錄下的startup.sh
腳本即可啟動skywalking服務:
[root@localhost /usr/local/skywalking]# bin/startup.sh
SkyWalking OAP started successfully!
SkyWalking Web Application started successfully!
[root@localhost /usr/local/skywalking]#
SkyWalking控制臺服務默認監(jiān)聽8080端口劫樟,若有防火墻需要開放該端口:
[root@localhost /usr/local/skywalking]# firewall-cmd --zone=public --add-port=8080/tcp --permanent
success
[root@localhost /usr/local/skywalking]# firewall-cmd --reload
success
[root@localhost /usr/local/skywalking]#
若希望允許遠程傳輸,則還需要開放11800(gRPC)和12800(rest)端口,遠程agent將通過該端口傳輸收集的數(shù)據(jù):
[root@localhost /usr/local/skywalking]# firewall-cmd --zone=public --add-port=11800/tcp --permanent
success
[root@localhost /usr/local/skywalking]# firewall-cmd --zone=public --add-port=12800/tcp --permanent
success
[root@localhost /usr/local/skywalking]# firewall-cmd --reload
success
[root@localhost /usr/local/skywalking]#
正常啟動成功后毅哗,使用瀏覽器訪問主頁如下:
搭建 SkyWalking 服務 - Windows
Windows下的搭建就更簡單了听怕,首先下載Windows平臺下的包:
解壓后目錄文件如下:
雙擊bin
目錄下的startup.bat
文件就可以運行SkyWalking服務了:
這里之所以介紹Windows下的搭建,是因為當SkyWalking收集服務部署在遠程服務器上時虑绵,本地要進行調試的話得用到agent
目錄下的jar包:
該agent
文件夾尿瞭,可以單獨復制出放在項目系統(tǒng)所在服務器的任意目錄下。agent
文件夾下的skywalking-agent.jar
即為監(jiān)控代理程序翅睛,只需要在jvm的啟動命令中加載該jar包声搁,即可完成監(jiān)控代理。
服務鏈路追蹤
在本文中主要介紹如何使用SkyWalking來實現(xiàn)服務鏈路追蹤捕发,關于服務鏈路追蹤的概念在下文中已進行過說明疏旨,這里就不再贅述了:
目前有多種工具可以實現(xiàn)服務鏈路追蹤,主流的工具對比可以參考如下文章:
以上小節(jié)完成了SkyWalking平臺服務的搭建扎酷,接下來進入項目整合環(huán)節(jié)檐涝,將SkyWalking提供的agent與我們的項目進行整合,以達到監(jiān)控目的法挨。這里事先創(chuàng)建了兩個簡單的Spring Cloud項目谁榜,分別是consumer和producer:
這兩個項目中均包含基礎的組件依賴:nacos-discovery、openfeign及web凡纳。因為SkyWalking是通過Java agent這種語言探針的方式進行數(shù)據(jù)的收集和上傳窃植,所以不需要像zipkin那樣添加額外的依賴和配置。
consumer將調用producer提供的接口荐糜,以達到后續(xù)在SkyWalking上展示一個簡單的調用鏈路效果巷怜。故在producer中編寫一個接口,代碼如下:
@Slf4j
@RestController
@RequestMapping("/producer")
public class ProducerController {
@GetMapping
public String producer() {
log.info("received a request");
return "this message from producer";
}
}
而consumer也有一個接口暴氏,該接口內(nèi)則是調用了producer的接口延塑。代碼如下:
@Slf4j
@RestController
@RequiredArgsConstructor
@RequestMapping("/consumer")
public class ConsumerController {
private final ProducerClient producerClient;
@GetMapping
public String consumer() {
log.info("consumer something");
// 通過feign調用
String result = producerClient.producer();
return "consumer: " + result;
}
}
ProducerClient
代碼如下:
@FeignClient("producer")
public interface ProducerClient {
@GetMapping("/producer")
String producer();
}
完成代碼編寫后,接下來我們需要為每個服務配置一個agent答渔,首先創(chuàng)建兩個與producer和consumer服務對應的目錄:
然后將skywalking里的agent目錄下的所有文件拷貝出來页畦,分別粘貼到這兩個新建的目錄中:
接著分別編輯這兩個目錄下的config/agent.config
文件,該文件是agent的配置文件研儒。修改其中的服務名稱,以及skywalking平臺后端服務的連接地址独令。producer配置示例如下:
# The service name in UI 服務名稱
agent.service_name=${SW_AGENT_NAME:producer}
# Backend service addresses. 收集后端服務的地址
collector.backend_service=${SW_AGENT_COLLECTOR_BACKEND_SERVICES:192.168.0.71:11800}
consumer里的配置文件也需要按照如上示例進行修改端朵,這里之所以分別拷貝了兩個agent是為了讓不同的服務使用不同的配置文件。
如果不想為每個服務都單獨拷貝一個agent目錄燃箭,則可以通過添加JVM啟動參數(shù)來覆寫配置項冲呢,這兩種方式視實際情況選擇即可。如下示例:
-javaagent:E:\skywalking\apache-skywalking-apm-bin\agent\skywalking-agent.jar
-Dskywalking.agent.service_name=consumer
-Dskywalking.collector.backend_service=192.168.0.71:11800
配置好agent之后招狸,在IDEA中添加Spring Boot引導類的JVM參數(shù)敬拓,指定skywalking-agent.jar
的目錄路徑:
完成以上步驟后邻薯,分別啟動producer和comsumer服務,請求/consumer
接口乘凸,因為skywalking是懶加載的厕诡,需要進行請求才會連接收集服務:
接著到SkyWalking的“追蹤”頁面上,就可以查看到調用鏈路信息了营勤。如下圖所示:
點擊鏈路上的節(jié)點可以查看到對應的詳情:
其他功能
服務拓撲圖:
端點監(jiān)控:
服務實例監(jiān)控:
如果集成agent成功后灵嫌,卻依舊發(fā)現(xiàn)監(jiān)控頁面上沒有數(shù)據(jù),日志里又沒有錯誤信息的話葛作,很有可能是時間范圍沒有選擇正確: