Unipus
歡迎光臨,   退出 登錄 或者 免費注冊 進入教學管理平臺
新疆十一选五彩票控

語料云

“語料云100”科研公益項目 申報地址

語料云——讓語言變得簡單

語料庫是按照一定采樣標準采集的電子文本集合,常用來研究一種語言或者語言變體。上個世紀80年代,語料庫開始應用于詞典編纂,并取得了顯著的成果,其代表作是柯林斯系列詞典。到目前為止,大部分詞典的編纂都使用到了語料庫。除了詞典編纂之外,語料庫在外語教學和科研中也得到了廣泛的應用。

在大數據時代,語料庫的規模也不斷擴大,柯林斯語料庫(Collins Corpus)的規模已經突破了45億詞。隨著語料庫數據規模的增大,傳統的語料庫軟件已經難以滿足需求,大數據語料的檢索和挖掘成為迫切需要解決的問題。另外,語料庫的建設和研究往往需要定制化的技術服務和專家指導。

在這樣的背景下,匯智明德(北京)教育科技有限公司與柯林斯出版集團、北京外研在線教育科技有限公司通力合作,推出了集語料庫建設與共享、語料庫檢索與挖掘、語料庫科研支持與服務于一身的大數據語料庫平臺——語料云(Corpus Cloud)。

語料云簡介

產品優勢

產品特點:

產品功能:

語料庫
服務
檢索
統計
搭配
詞表
關鍵詞計算
文本分析
實用工具
  • 語料庫
  • ? BNC、BROWN、FROWN、CROWN 等多種免費語料庫
  • ? 版權引進Bank of English、Collins Corpus 等多種大型商用語料庫
  • ? 多種學習者語料庫
  • ? 大量用戶共享的語料庫
  • 服務
  • ? 用戶自建語料庫支持
  • ? 專家在線答疑服務
  • ? 語料數據抓取和數據清理服務
  • ? 語料分析和數據處理服務
  • ? 語料云使用培訓
  • 檢索
  • ? 內置Smart Query 檢索引擎,支持詞匯、語碼、句法結構和抽象符號混合的檢索表達式
  • ? 支持批量檢索
  • ? 支持多種排序方式,支持用戶自定義排序
  • ? 支持豐富的篩選功能
  • ? 支持多種數據樣式和顯示樣式
  • ? 支持索引行手動標注、手動分類,支持多維標簽體系
  • ? 支持索引行智能歸類、語義趨向分析和語義韻分析
  • 統計
  • ? 支持針對抽象結構的統計
  • ? 結果顯示支持Input、Word、Lemma 等8 種不同數據類型
  • ? 支持重要性統計,可以計算出檢索內容的重要程度
  • ? 支持變量標記,可以單獨對局部結構進行統計
  • ? 支持柱狀圖、折線圖、餅狀圖、詞云等多種數據可視化手段
  • ? 支持對比分析,可以對比不同命中內容的分布情況
  • ? 支持智能報表,可以對檢索內容的分布情況進行自動總結
  • 搭配
  • ? 支持針對單詞、語碼、短語、句法結構、混合抽象表達式的搭配計算
  • ? 結果顯示支持Input、Word、Lemma 等8 種不同數據類型
  • ? 支持MI、MI3、T-Score、Z-Score、Log-Log、 Dice、Log-likelihood Ratio、Effect Size、Delta-p、Chi-Square、RevisedLog-likelihood Ratio、Revised Delta-p、Revised Chi-Square 等不同搭配強度計算方式
  • ? 支持針對非連續結構搭配強度的計算
  • ? 支持逆向搭配強度的計算,可以計算出配詞對節點詞的吸附強度
  • ? 按位置和子庫兩個維度,提供多種數據分布報表
  • ? 支持對比分析,可以對比不同搭配詞搭配強度的分布情況
  • ? 支持智能報表,可以對檢索內容的搭配情況進行自動總結
  • 詞表
  • ? 支持n-gram
  • ? 支持不同數據類型
  • ? 支持二次過濾
  • ? 支持分布信息
  • ? 支持重要性計算
  • ? 支持柱狀圖、折線圖、餅狀圖、詞云等多種數據可視化手段
  • ? 支持對比分析,可以對比不同詞匯的分布情況
  • 關鍵詞計算
  • ? 支持基于Word、Lemma 等不同數據類型的關鍵詞計算
  • ? 支持多種Chi-Square、Log-likelihood Ratio 等多種計算方式
  • ? 支持Key Keyness 的計算
  • 文本分析
  • ? 支持音節數、Tokens、Types、Lemma Types、 TTR、STTR、平均詞長、句子數、平均句長、從句數、T-Unit 數量、段落數量、平均段落長度等數據的文本基礎信息分析
  • ? 支持基于Nation 詞族表、柯林斯分級詞匯表和自定義詞族表的詞匯難度分析
  • ? 支持句法復雜度分析
  • ? 支持文本可讀性分析
  • ? 支持基于CEFR 的文本難度自動分級
  • ? 支持基于不同Thesaurus 和維基百科術語列表的語義空間分析
  • ? 支持智能報表,可以對分析結果進行自動總結
  • 實用工具
  • ? 詞云工具
  • ? 句法樹和依存關系分析工具
  • ? 近義詞辨析工具
  • ? 詞匯- 語法描述工具
  • ? 多種柯林斯權威詞典

語料云QQ群:

掃一掃二維碼,加入該群

產品咨詢(試用申請):