99re在线视频观看|日韩 欧美 国产 亚洲 制服|男人的天堂视频网站清风阁|亚洲经典激情春色另类|五月天精品视频

南京大學“雙創”新聞數據平臺問世啦

2018-11-01 12:10:00
admin
原創

南京大學“雙創”新聞數據平臺問世啦

2018年10月29日,由上海萌泰數據科技股份有限公司和南京大學新聞傳播學院合作開發的南京大學雙創新聞數據平臺的在南京大學新聞傳播學院進行了成果展示。


在此次會議上,上海萌泰數據科技股份有限公司總經理李軍詳細介紹了新聞數據平臺的功能。包括網頁爬蟲、搜索引擎、文本分析和分布式計算技術等。


伴隨著專業細化、學科交叉、知識爆炸的信息社會全面來臨,各行業各層次人士都面臨著如何及時、準確、高效地獲取信息這一社會性難題。由國家統籌建設的大型綜合化數據庫,在滿足社會信息需求方面主要地扮演了“百科全書”式角色, 其重要性不可低估。

 

但是,對于特定地域、特定行業、特定專業或特定專題的個性化信息需求,綜合數據庫大概主要起方向性、指導性作用,而不能很好滿足諸如科研人員、市場企劃人員等對特定領域信息的系統深入需求。因此,為了滿足數字化信息的集合和用戶個性化需求的發展, 迫切需要建設一批有規模、有特色、有權威的專題數據庫。

南京大學雙創新聞數據平臺的建設


 南京大學雙創新聞數據平臺的建設為社會科學學術研究搭建一個可以提供  全維度歷史數據查詢的新聞大數據開放研究平臺,平臺擬采用分布式文本  采集技術面向全網媒體構建面向各個領域,各個主題的各類新聞熱點事件  的數據庫,并應用文本分析、數據挖掘、人工智能、數據可視化等大數據  分析手段,從新聞文本內容中提取時間、空間、人物、事件、觀點、情感  等內容,實現對各類新聞事件的多維度可視化呈現和分析研究。

1.建設意義

南京大學雙創新聞數據庫基于靈活的可配置的數據采集和數據處理規則,力圖打造成一個公共的新聞研究開放數據庫平臺,支持定制面向各個主題的專題數據庫,最終建設成能夠覆蓋全媒體,全領域,全時域的新聞事件數據庫,為相關領域的學者、媒體機構、政府機構等用戶提供分析和研究的公共數據服務平臺。

2.服務對象

南京大學“雙創”新聞數據平臺是一個面向廣大研發人員的特色新聞大數據開放研究平臺,其服務對象主要包括開發人員、項目經理、用戶、測試人員或文檔的編寫人員等。

3.內容介紹

新聞數據庫共收錄了中國大陸地區的300家媒體網站上的數據。新聞內容覆蓋2015年國家網信辦公布可供網站轉載新聞的所有新聞單位(合計380家)的全部數據,包括中央新聞網站、部委網站、地方新聞網站、中央新聞單位(報刊和雜志)、省級新聞單位(報刊)以及廣電新聞機構。

南京大學“雙創”新聞數據庫及分析平臺是一套面向互聯網新聞大數據領域,集互聯網數據動態采集、文本搜索、文本分析、專題數據庫管理于一體的大數據研究服務平臺。平臺能夠提供對互聯網文本數據的采集、存儲、檢索和分析等功能,平臺可以集成 Hadoop 技術框架,支持分布式計算,具有穩定、可靠、高性能和高可擴展性。

目前南京大學“雙創”新聞數據平臺尚處于小規模使用中,有望今年年底正式對外提供服務。

    發表評論
    評論通過審核后顯示。
    移動訪問