调用链 trace
系统可以帮助技术人员快速的定位问题,查看整个请求的调用链路,及各个链路的耗时情况。方便技术人员针对性的对服务进行性能优化。
参考 调用链trace的设计分析
的介绍, trace
系统的要素包括: traceId
、 spanId
、 annotation
。
traceId
:贯穿整个调用链路,通过 traceId
来关联链路的所有相关日志 spanId
:标识单次请求调用 annotation
:记录请求调用的附加信息 trace
日志设计 在 调用链trace的设计分析
文章中,系统 log
设计相对复杂,先从最简单的入手开始了解。
微服务A、B、C之间存在相互调用关系,我们为每次请求记录一条 log
。通过 log
中的 parnetID
来确定调用的层级关系,通过 spanID
来唯标识一个独立请求,通过 traceID
来收敛所有相关日志。最终就可以确定请求的调用层级结构。
从 SERVER-C
可以看出,日志记录在 C
服务的总处理时间。在结合 SERVER-B
的发起请求时间,可以初略得出 span2
的网络耗时。
特别注意一下 span
的变化。当向下游服务发起请求时,需要生成一个新的 span
,并将该 span
的父节点设置成上一步生成的 span
。 SERVER-B
请求 SERVER-C
描述的就是这个过程。
而当服务收到一个请求时,只有当请求没有关联新的 span
时,才需要生成一个 span
。 SERVER-C
收到 SERVER-B
的请求,描述的是这种情况。
Other
日志设计 调用链trace的设计分析
文章又是如何实现的呢?文章给出的调用关系如下:
两者的区别在于:确定层级的方式不同。这里通过 span
值的创建规则来确定调用的层级。而前者是通过借助 parentID
来确定层级。
Annotation
通过 基于Zipkin的Thrift服务RPC调用链跟踪
文章了解到,存储 span
信息可以通过 Annotation
和 BinaryAnnotation
来实现。
Annotation
用于记录某个时间点发生的 event
,对 event
的触发时间、类型有明确规定。而 BinaryAnnotation
则用来记录用户自定义的信息。也就是说:前者是公用的,后者是个人用的。
因为反向代理路径重写的原因,客户端请求的 path
和服务端提供服务的 path
可能不相同,如果你想在系统中定位这种情况,那么你就可以将 http.url
追加到 BinaryAnnotaion
属性中。
了解一下 BinaryAnnotation
日志存储的数据内容:
{ "app": "app", //所属应用 "ip": "ip", //ip地址,冗余信息 "key": "key", //key, 可以设为存储用户session的key, 如果是用来传递用户session信息的, 可以统一约定为: session_id "mname": "mname", //方法名 "pid": "10000", //进程id,冗余信息 "sid": "sid", //spanId "sname": "sname", //服务名 "tid": "tid", //traceId "timestamp": 1449038780194, //产生的时间戳, 长整型, 精确到毫秒 "type": "type", //类型,用来区分是记录异常的还是业务流程的等等, 默认是'common'即可 "value": "value" //如果是传递用户session信息 ,可以直接写在该字段中. }
参考地址:
调用链trace的设计分析
分布式会话跟踪系统架构设计与实践
基于Zipkin的Thrift服务RPC调用链跟踪