转载

Blog.6 分布式会话跟踪系统架构设计与实践

调用链 trace 系统可以帮助技术人员快速的定位问题，查看整个请求的调用链路，及各个链路的耗时情况。方便技术人员针对性的对服务进行性能优化。

概念

参考 调用链trace的设计分析 的介绍， trace 系统的要素包括： traceId 、 spanId 、 annotation 。

traceId ：贯穿整个调用链路，通过 traceId 来关联链路的所有相关日志
spanId ：标识单次请求调用
annotation ：记录请求调用的附加信息

简化 `trace` 日志设计

在 调用链trace的设计分析 文章中，系统 log 设计相对复杂，先从最简单的入手开始了解。

微服务A、B、C之间存在相互调用关系，我们为每次请求记录一条 log 。通过 log 中的 parnetID 来确定调用的层级关系，通过 spanID 来唯标识一个独立请求，通过 traceID 来收敛所有相关日志。最终就可以确定请求的调用层级结构。

Blog.6 分布式会话跟踪系统架构设计与实践

从 SERVER-C 可以看出，日志记录在 C 服务的总处理时间。在结合 SERVER-B 的发起请求时间，可以初略得出 span2 的网络耗时。

特别注意一下 span 的变化。当向下游服务发起请求时，需要生成一个新的 span ，并将该 span 的父节点设置成上一步生成的 span 。 SERVER-B 请求 SERVER-C 描述的就是这个过程。

而当服务收到一个请求时，只有当请求没有关联新的 span 时，才需要生成一个 span 。 SERVER-C 收到 SERVER-B 的请求，描述的是这种情况。

`Other` 日志设计

调用链trace的设计分析 文章又是如何实现的呢？文章给出的调用关系如下：

Blog.6 分布式会话跟踪系统架构设计与实践

两者的区别在于：确定层级的方式不同。这里通过 span 值的创建规则来确定调用的层级。而前者是通过借助 parentID 来确定层级。

Blog.6 分布式会话跟踪系统架构设计与实践

`Annotation`

通过 基于Zipkin的Thrift服务RPC调用链跟踪 文章了解到，存储 span 信息可以通过 Annotation 和 BinaryAnnotation 来实现。

Annotation 用于记录某个时间点发生的 event ，对 event 的触发时间、类型有明确规定。而 BinaryAnnotation 则用来记录用户自定义的信息。也就是说：前者是公用的，后者是个人用的。

因为反向代理路径重写的原因，客户端请求的 path 和服务端提供服务的 path 可能不相同，如果你想在系统中定位这种情况，那么你就可以将 http.url 追加到 BinaryAnnotaion 属性中。

了解一下 BinaryAnnotation 日志存储的数据内容：

{
    "app": "app", //所属应用
    "ip": "ip", //ip地址,冗余信息
    "key": "key", //key, 可以设为存储用户session的key, 如果是用来传递用户session信息的, 可以统一约定为: session_id
    "mname": "mname",  //方法名
    "pid": "10000", //进程id,冗余信息
    "sid": "sid", //spanId
    "sname": "sname", //服务名
    "tid": "tid", //traceId
    "timestamp": 1449038780194, //产生的时间戳, 长整型, 精确到毫秒
    "type": "type", //类型,用来区分是记录异常的还是业务流程的等等, 默认是'common'即可
    "value": "value" //如果是传递用户session信息 ,可以直接写在该字段中.
}

参考地址：