1. 概述
當我們處理資料時,經常從資料的匯入開始,依次經歷清洗、結構調整、多表分析、新增輔助分析欄位,直至最終的發佈和管理。那麼本文依據這個順序整理了資料編輯的核心知識點。若您是新手使用者,可依據本文逐漸學習和掌握資料編輯的使用方法和功能。
2. 編輯資料學習路徑
章節 | 標題 | 內容簡介 | 文檔 |
---|---|---|---|
第 1 章 新增資料 | |||
1.1 | 新增資料到主題 | 將資料新增到主題中,然後可對新增的資料編輯 | 新增資料概述 |
1.2 | 編輯資料概述 | 瞭解資料編輯介面,以及大致的功能入口 | 編輯資料概述 |
第 2 章 資料簡單清洗 | |||
2.1 | 過濾 | 對資料過濾 | 過濾(資料集) |
2.2 | 排序 | 對資料排序 | 排序 |
2.3 | 刪除重複列 | 進行去重判斷,刪除資料表中的重複行 | 刪除重複列 |
第 3 章 調整資料結構 | |||
3.1 | 拆分列 | 將一個欄位拆分為多個欄位 | 拆分列欄 |
3.2 | 拆分行 | 將一個欄位拆分為多行 | 拆分列欄 |
3.3 | 列轉欄 | 將某列的欄位值,生成新欄位的表頭,通常用來將一位錶轉化為二維表 | 列轉欄 |
3.4 | 欄轉列 | 將二維錶轉化為一維表 | 欄轉列(逆透視) |
3.5 | 分組匯總 | 對資料進行分組,再對分組後的資料進行匯總計算,相當於 Excel 中的資料透視表,分組匯總獲得的結果會改變資料粒度和結構 | 分組匯總 |
3.6 | 欄位設定 | 1)更改欄位類型 2)修改欄位名稱 3)調整欄位順序 4)隱藏不需要的欄位 | 欄位設定 |
第 4 章 多表分析 | |||
4.1 | 上下連接 | 將多張表上下連接成一張表 | 上下合併 |
4.2 | 左右連接 | 將多張表的欄位左右連接到一起,形成一張寬表 | 左右合併 |
4.3 | 其他表新增列 | 將其他表的欄位新增到當前表,可實現類似 Excel 的 lookup、sumif的效果 | 其他表新增欄 |
第 5 章 新增分析欄位 | |||
5.1 | 新增公式欄 | 使用公式函式對原有欄位進行計算獲得新的欄位 | 新增公式欄 |
5.2 | 新增條件標籤列 | 透過對已有列進行條件判斷,給不同條件的行打上不同標籤 | 新增條件標籤欄 |
5.3 | 新增匯總列 | 不影響原有欄位的基礎上進行匯總計算,獲得匯總欄位 | 新增匯總欄 |
5.4 | 新增指派列 | 對資料進行分組,並新增一個分組欄位 | 新增指派欄 |
5.5 | 時間差 | 使用兩個時間欄位相減,獲得時間差欄位 | 時間差 |
5.6 | 獲取時間 | 獲得原日期欄位的不同時間粒度值 | 獲取時間 |
第 6 章 發佈和管理 | |||
6.1 | 管理資料 | 對資料編輯、儲存、另存、重新命名、行動、刪除、更新等 | 管理資料功能 |
6.2 | 發佈資料 | 將處理好的資料發佈到公共資料中,供他人使用 | 發佈資料 |
第 7 章 多表分析進階:主題模型 | |||
7.1 | 模型新手入門 | 模型如何操作 | 主題模型簡介及構建方法 |
7.2 | 瞭解模型使用原理 | 模型能解決的問題和優勢 | 從一個簡單的例子開始 |