鏈路追蹤簡介

  • 最後修改時間:2025-01-24
  • 1. 概述

    FineOps維運平台提供健康觀測與鏈路追蹤功能,幫助管理者定位使用者查看、分析儀表板/報表的效能卡慢問題。

    本文將基於不同的使用場景,講述FineOps如何對「FineReport範本/FineBI儀表板/FineDataLink任務」的效能問題進行定位。

    2. 應用場景

    問題場景
    歷史解決方案FineOps解決方案
    使用者向管理者反饋,感覺系統使用卡慢

    1)無法衡量和定位問題

    2)需要被動的等待使用者反饋問題

    排查步驟:

    查看「系统健康观测

    • 若「效能指數APDEX」過低,說明系統整體發生了卡慢

    • 若「請求成功率」過低,說明系統出現了故障

    • 繼續查看「服務回應時間」和「資料回應時間」,判斷到底是資料回應卡慢,還是其他原因卡慢

    解決效果:

    1)管理者可以自行查看系統健康觀測,在使用者反饋前主動發現系統出現了卡慢,無需被動等待

    2)將使用者實際體驗,以資料形式準確展示出來

    在系統健康觀測,發現效能分數過低時管理者可以拿日誌、打堆疊,自行排查問題

    排查步驟:

    查看「系统资源监控」,檢查系統是否發生了GC,或CPU已滿

    解決效果:

    快速定位到GC等問題

    使用者使用某種儀表板/範本時,感覺卡慢

    1)需要被動的等待使用者反饋問題

    2)需要拿日誌自行分析

    排查步驟:

    1)無需等待使用者反饋,檢查「系统健康观测」的看板圖表異常點

    2)聯動跳轉至「首屏链路」分析

    查看該時間段內使用者查看了哪些報表,查看使用者的查詢耗時等

    對於標黃展示的首屏鏈路,代表該首屏鏈路耗時或其聯動的呼叫鏈路耗時超過了10S

    3)建議再聯動跳轉至「调用链路」分析,進一步定位分析慢的請求,可以進行問題定位,精確到網路波動、資料庫效能、配置庫、複雜資源、資源不足等問題

    解決效果:

    還原使用者真實體驗,並將定位時間縮短至10分鐘內

    排查步驟:

    1)無需等待使用者反饋,檢查「系统健康观测」捕捉到的效能過慢(>10s)的請求

    2)聯動跳轉至「首屏链路」分析

    查看該報表對應的查看使用者和使用耗時等

    對於標黃展示的首屏鏈路,代表該首屏鏈路耗時或其聯動的呼叫鏈路耗時超過了10S

    3)建議再聯動跳轉至「调用链路」分析,進一步定位分析慢的請求,可以進行問題定位,精確到網路波動、資料庫效能、配置庫、複雜資源、資源不足等問題

    解決效果:

    還原使用者真實體驗,並將定位時間從縮短至10分鐘內


    附件列表


    主題: 專案管理
    已經是第一篇
    已經是最後一篇
    • 有幫助
    • 沒幫助
    • 只是瀏覽