用文字挖掘剖析近5萬首《全唐詩》,發現了這些有趣的秘密
導讀:本文內容從文字(資料)挖掘的角度去“探索”全唐詩,挑戰一些不同場景下(現代漢語和古漢語)文字處理和分析的異同點,錘煉分析技能;但更想做的是,結合資料之美和詩歌之雅,用跨界思維去發現一些有趣的東西。 近些年來,弘揚中華傳統文化的現象級綜...
導讀:本文內容從文字(資料)挖掘的角度去“探索”全唐詩,挑戰一些不同場景下(現代漢語和古漢語)文字處理和分析的異同點,錘煉分析技能;但更想做的是,結合資料之美和詩歌之雅,用跨界思維去發現一些有趣的東西。 近些年來,弘揚中華傳統文化的現象級綜...
如果你不甘心一直在寫增刪改查,希望看到更廣的技術世界,阿裡技術團隊重磅釋出的《阿裡技術參考圖冊》,總計600餘頁,現已開放下載,將為你呈現阿裡技術全景,走進各個技術領域的世界。 此書邀請了阿裡多個重要部門的研究員、資深技術專家、資深演演算法專...
導讀:GitHub 上有大約有 744K 多的 Java 專案,但是最讓開發人員感興趣的有哪些專案?本文列舉了 GitHub 上最受歡迎的 5 個 Java 專案,從 Mockitos 到 Guava,以及 java-design-patt...
導讀:面對一個新資料集時,人們往往會關心資料中的異常值、資料的分佈形式、行列之間的關係等。SQL是一種專為資料計算設計的語言,其中已經內建了許多資料彙總函式,也支援使用者編寫SQL命令實現更為複雜的彙總需求。 作者:Matt DeLand,W...
導讀:這是清華大學電腦科學與技術系教授、博士生導師孫富春在機械工業出版社講座交流時的PPT,內容包括了人工智慧產業的歷史背景、現狀及未來發展趨勢。這180頁的PPT乾貨多多,趕緊收藏起來吧! 作者:孫富春 來源:機工教育(ID:cmped...
解決口徑對不齊問題的關鍵點之一,便是:指標命名。 在簡單的業務場景中,抓住以下幾點,指標的命名一般不成問題: 指標名稱“名副其實”和“簡潔易懂” 遵照一定的行業慣例或者規範(如財務指標、電商經營指標) 當業務規模大,相似的職能線多,相似的部...
資料是創造和決策的原材料,高質量的資料都價值不菲。而利用爬蟲,我們可以獲取大量的價值資料,經分析可以發揮巨大的價值,比如: 豆瓣、知乎:爬取優質答案,篩選出各話題下熱門內容,探索使用者的輿論導向。 淘寶、京東:抓取商品、評論及銷量資料,對各種...
導讀:兵法有雲:三軍未動糧草先行。對於程式員來說,糧草莫過於一干好用的工具了。下麵推薦幾款比較好用的輔助工具。特別對於初學者來說,學習程式設計之初就瞭解這些工具,會讓你的學習事半功倍。 兵法有雲:三軍未動糧草先行。對於程式員來說,糧草莫過於一干...
導讀:你喜歡編寫個人專案嗎?你是否曾經參與過開源專案?你覺得自己開發自己的程式設計專案,還是對現有的開源工作做出貢獻會更有益處?你將如何比較為開源軟體組織和專有軟體的組織編碼獲得的聲望? ▲圖片來自:opensource.com 年輕程式員的技...
掃描下方二維碼 前300名免費領取學習名額 ↓ ↓ ↓ ↓ ↓ ↓ 給大家看一份最新的資料: ▲(薪資表)2018年最新資料: python、大資料、人工智慧從業者工資 為什麼人工智慧行業的工資那麼高? 無論是科研院所,商業巨頭還是初創企...