Skip to content

MinchaoZhu/Chinese-Corpus-Process

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 

Repository files navigation

中文语料库

建立SOAP协议的中文预料Web Service.

作者的Web Service发布页面: service.bayesian.top

前端部署应用 https://tools.bayesian.top/idiom/

语料库

中华新华字典数据库。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。

功能

0. 数据录入数据库

branch sql: 找一个带main入口的java程序载入DataToDatabase 类

1. 成语 Web Service

Branch idiom:

mvn package
/**
    * 随机获取一个成语;
    * 
    * @return String: 一个成语的字符串;
    */
public String getRandomIdiom();

/**
    * 根据首字拼音获取数据库内所有符合的成语;
    * 
    * @param arg0 String: 首字拼音, 可以带声调;
    * @return String: 多个成语组成的字符串, 以空格分开;
    */
public String getIdiomsByFirstpinyin(String arg0);

/**
    * 根据最后一个字的拼音获取数据库内所有符合的成语;
    * 
    * @param arg0 String: 尾字拼音, 可以带声调;
    * @return String: 多个成语组成的字符串, 以空格分开;
    */
public String getIdiomsByLastpinyin(String arg0);

/**
    * 根据首字拼音获取数据库内随机一个成语;
    * 
    * @param arg0 String: 首字拼音, 可以带声调;
    * @return String: 一个成语的字符串;
    */
public String getRandomIdiomByFirstPinyin(String arg0);

/**
    * 根据尾字拼音获取数据库内随机一个成语;
    * 
    * @param arg0 String: 尾字拼音, 可以带声调;
    * @return String: 一个成语的字符串;
    */
public String getRandomIdiomByLastPinyin(String arg0);

/**
    * 查询一个成语;
    * 
    * @param arg0 String: 成语字符串;
    * @return String: 若不存在, 则返回空字符串; 若存在, 则返回成语信息的JSON字符串;
    */
public String findIdiom(String arg0);

/**
    * 获取可以和输入成语形成接龙的所有成语;
    * 
    * @param arg0 String: 成语字符串;
    * @return String: 所有可以形成接龙的成语, 以空格分隔. 若无则返回空字符串;
    */
public String findJielongIdioms(String arg0);

/**
    * 获取随机一个和输入成语形成接龙的成语;
    * 
    * @param arg0 String: 成语字符串;
    * @return String: 一个可以形成接龙的成语, 若无则返回空字符串;
    */
public String findJielongIdiom(String arg0);

/**
 * 获得输入成语的首字拼音
 * @param idiom String: 成语字符串
 * @return String: 首字拼音, 如成语不存在则返回空字符串
 */
String getFirstPinyin(String idiom);

/**
 * 获得输入成语的尾字拼音
 * @param idiom String: 成语字符串
 * @return String: 尾字拼音, 如成语不存在则返回空字符串
 */
String getLastPinyin(String idiom);

/**
 * 判断idiom2在idiom1后面, 是否形成接龙
 * @param idiom1 String: 第一个成语
 * @param idiom2 String: 第二个成语
 * @return String: 形成接龙返回"1", 否则返回空字符串
 */
String checkJielong(String idiom1, String idiom2);

TODO

  • 数据库导入
  • Idiom 成语
  • Xiehouyu 歇后语
  • word 汉字
  • ci ciyu

About

中文语料Web服务(汉字, 词语, 成语, 歇后语) 词典

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published