:::臺北市單一陳情系統HELLO TAIPEI之大數據應用研究
臺北市單一陳情系統HELLO TAIPEI之大數據應用研究 委託報告
資料項目 | 檔案大小 | 檔案格式 | 更新時間 | 操作 |
---|---|---|---|---|
1080212-pdf-testproj-162054.pdf | 12.68 MB | 2021-03-22 16:09:59 |
計畫摘要 | 臺北市單一陳情系統「HELLO TAIPEI」於105年11月1日正式上線,本系統整合多元陳情管道,並以分案自動化、處理迅速化之技術,逐步實現市長fix TPE政見-即時問題回報,打造友善臺北之理念。本研究案透過大數據分析技術,解析民眾陳情資料,以作為政策研擬之參考與依據。因此,本案成果將有利臺北市政府研究發展考核委員會人員及幕僚,更能掌握及呈現臺北市單一陳情系統「HELLO TAIPEI」資料。本研究盤點現有臺北市單一陳情系統「HELLO TAIPEI」陳情數據及彙整臺北市業務單位需求後,研究重點及重大發現包含四項: 1. 儀表板警示燈號建議,檢視國內外其他城市儀表板案例,接著提出其他建議參考指標,並建置儀表板及警示燈號 (區分綠、黃、紅燈)雛型,利用自然語言文字分析技術,搭配文字雲視覺化呈現,了解民陳情資訊輪廓,快速理解該次分類今日所發生之特殊事件,並透過燈號的警示,由正常到最嚴重,了解陳情項目數量的變化。2. 陳情資料之重分類,運用市府人工判讀之 3,204 筆資料進行模型訓練,將全部陳情資料分類至新主次類別,本研究透過三個不同方法下取得的特徵值,再將輸出的訓練集特徵值與原訓練集結合,做為模型之訓練集,分別採用三個不同的機器學習模型,進行模型訓練與重分類工作,結果顯示選擇隨機森林演算法,結合由陳情主旨所萃取出之陳情特徵來進行分類,可以得到較高的準確率。3. 陳情案件人名遮罩評估,針對陳情內容中的人名進行比對,並計算相對應的次數,用來量化目前可能的隱私洩漏程度,雖然目前自動化技術可以進行遮蓋或取代,但依然可能會有疏漏 (如姓名未包含在目前清單中),需要人工進行比對。因此未來進行相關資訊運用時,仍須仰賴人工協助確認洩漏情形,才能達到較為完備的去識別化效果。4. 資料分析處理方案建議,本團隊訪談臺北市政府研考會、臺北市政府交通局、臺北市政府環保局、臺北市政府消防局、臺北市政府警察局等五個單位,挑選4 個案例,包含: (1)警政消防;(2)公車、計程車、復康巴士問題;(3)微笑單車;(4)污染舉發,從基本統計資料、以及訪談後所建立的外部影響因子資料庫,包含活動、事件、颱風、假期因子,分別利用兩個模型,線性迴歸(Multiple Linear Regression)與廣義線性模型 (Poisson Regression),分析不同陳情類別的數量預測模型,建議未來該模式的延伸與應用,可以透過更多因子的收集,提高模型預估的準確性,並且可以整合於儀表板及警示燈號使用。最後,本研究以資料驅動方式獲取儀表板警示之建議方式、以及新分類演算法等成果。針對未來相關資料應用與發展,本團隊提出以下6點建議: (1)建立臺北市市政字詞資料庫刻不容緩。(2)識別重複陳情案件/提案人。(3)建立去識別化機制與能量。(4)建立開放資料 API。(5)持續優化陳情資料重分類。(6)建議與圖資整合可行性。 |
---|---|
資料集研究(主辦)機關 | 研考會 |
一級機關 | 臺北市政府研究發展考核委員會 |
年度 | 107 |
研究單位 | 逢甲大學 |
研究主持人 | 許懷中 |
關鍵詞 | 個人資訊遮罩技術,地理資訊系統,廣義線性模型,機器學習,線性迴歸模型,臺北市單一陳情系統HELLO_TAIPEI儀表板,陳情資料之重分類 |
備註 | 本專區110年以前為歷史轉檔資料,因新舊平臺欄位規格不同,故有部分詮釋資料欄位無資訊;如對資料內容有疑義,請洽資料集主辦機關或本府研考會研究發展組。 |