C#调用百度翻译实现翻译HALCON的示例

准备工作

halcon示例程序的描述部分一直是英文的,看起来很不方便。我决定汉化一下halcon示例程序的描述,准备工作如下:

拿到halcon的例程描述文件index_examples_en_us.xml,我的在c:\program files\mvtec\halcon-18.11-progress\help,其它版本类似。在注册拿到自己的id和密钥,开通通用翻译api服务。

注:百度官方有提供通用翻译api的使用demo,不过比较简单,c# demo下载

参数简介

通用翻译api的https 地址为,使用方法参考通用翻译api接入文档 。

输入参数

请求方式可使用 get 或 post 方式(content-type 请指定为:application/x-www-form-urlencoded),字符编码统一采用 utf-8 编码格式,单次请求长度控制在 6000 bytes以内(汉字约为输入参数 2000 个)。
将api需要的输入参数封装为一个类(id和密钥换成自己的),代码如下:

/// <summary>
/// 输入产数
/// </summary>
class inputquery
{
    /// <summary>
    /// app id
    /// </summary>
    private static string appid = "2021xxxxxxx0626";
    /// <summary>
    /// 密钥
    /// </summary>
    private static string password = "cnblongsxtimefiles";


    /// <summary>
    /// 请求翻译query utf-8编码
    /// </summary>
    public string content { get; set; }
    /// <summary>
    /// 翻译源语言 可设置为auto
    /// </summary>
    public string from { get; set; }
    /// <summary>
    /// 翻译目标语言 不可设置为auto
    /// </summary>
    public string to { get; set; }
    /// <summary>
    /// app id
    /// </summary>
    public string appid { get; set; }
    /// <summary>
    /// 随机数 可为字母或数字的字符串
    /// </summary>
    public string salt { get; set; }
    /// <summary>
    /// 签名 appid+q+salt+密钥的md5值
    /// </summary>
    public string sign { get; set; }

    /// <summary>
    /// 构造函数
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <param name="fromstr">源语言</param>
    /// <param name="tostr">目标语言</param>
    public inputquery(string content, string fromstr, string tostr)
    {
        content = content;
        from = fromstr;
        to = tostr;
        appid = appid;

        string randomnum = new random().next().tostring();
        string md5sign = getmd5(appid + content + randomnum + password).tolower();
        salt = randomnum;
        sign = md5sign;
    }

    /// <summary>
    /// 计算字符串的md5值
    /// </summary>
    static string getmd5(string source)
    {
        md5cryptoserviceprovider md5 = new md5cryptoserviceprovider();
        byte[] data = encoding.utf8.getbytes(source);
        byte[] md5data = md5.computehash(data, 0, data.length);
        md5.clear();

        string deststring = string.empty;
        for (int i = 0; i < md5data.length; i++)
        {
            deststring += convert.tostring(md5data[i], 16).padleft(2, '0');
        }
        deststring = deststring.padleft(32, '0');
        return deststring;
    }
}

输出参数

api返回的结果是json格式,需要反序列为对象实例后再进行处理。为了减少第三方库的依赖,反序列化使用.net自带的datacontractjsonserializer。
封装的输出参数类代码如下:

/// <summary>
/// 输出参数
/// </summary>
[datacontract]
class outputresult
{
    
    /// <summary>
    /// 错误码 仅当出现错误时显示
    /// </summary>
    [datamember(name = "error_code")]
    public string error_code { set; get; }

    /// <summary>
    /// 错误信息
    /// </summary>
    [datamember(name = "error_msg")]
    public string error_msg { set; get; }

    /// <summary>
    /// 源语言 返回用户指定的语言,或者自动检测出的语种(源语言设为 auto 时)
    /// </summary>
    [datamember(name = "from")]
    public string from { set; get; }

    /// <summary>
    /// 目标语言 返回用户指定的目标语言
    /// </summary>
    [datamember(name = "to")]
    public string to { set; get; }

    /// <summary>
    /// 翻译结果 返回翻译结果,包括 src 和 dst 字段
    /// </summary>
    [datamember(name = "trans_result")]
    public translatecontent[] trans_result { set; get; }
}
/// <summary>
/// 翻译结果
/// </summary>
[datacontract]
class translatecontent
{
    /// <summary>
    /// 原文
    /// </summary>
    [datamember(name = "src")]
    public string src { set; get; }

    /// <summary>
    /// 译文
    /// </summary>
    [datamember(name = "dst")]
    public string dst { set; get; }
}

使用httpclient

调用api需要一个类发送 http 请求以及接收http响应,推荐使用httpclient类(微软不建议使用webclient、httpwebrequest类)。
需要注意的是:httpclient 用于在应用程序的整个生存期内实例化一次并重复使用,也就是说一个应用程序只需要一个httpclient单例即可,代码如下:

public class goodcontroller
{
    public static readonly httpclient httpclient;

    static goodcontroller()
    {
        httpclient = new httpclient();
    }
}

翻译工具类

将api的调用方法封装成一个translate类,目前只提供一个英翻中的方法,其它翻译需求可以参考 自己扩展。
translate类代码如下(注意添加system.web依赖项):

/// <summary>
/// 百度通用翻译api工具类
/// </summary>
class translate
{
    /*
     * 代码链接:https://www.cnblogs.com/timefiles/p/baidutranslateapi.html
     * 创建时间:2021/06/26
     * 主页链接:https://www.cnblogs.com/timefiles/
     * 
     * 常用的语种代码:
     * 自动检测	auto	
     * 中文	zh	
     * 英语	en
     * 日语	jp
     */

    /// <summary>
    /// 英文翻译为中文
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <returns></returns>
    public static string entozh(string content)
    {
        string languagefrom = "en", languageto = "zh";
        return gettranslateresult(content, languagefrom, languageto);
    }

    /// <summary>
    /// 获取翻译结果
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <param name="fromstr">源语言</param>
    /// <param name="tostr">目标语言</param>
    /// <returns></returns>
    static string gettranslateresult(string content, string fromstr, string tostr)
    {
        inputquery input = new inputquery(content, fromstr, tostr);
        uri uri = geturi(input);
        var task = getoutputresultasync(uri);
        //个人认证后api的每秒请求量最高为10,异步意义不大,直接使用同步的方式
        outputresult output = task.result;
        if (output.error_code == null)
        {
            return output.trans_result[0].dst;
        }
        else
        {
            throw new exception("翻译异常,错误代码:" + output.error_msg);
        }
    }

    /// <summary>
    /// 获取请求uri
    /// </summary>
    /// <param name="input"></param>
    /// <returns></returns>
    static uri geturi(inputquery input)
    {
        var query = httputility.parsequerystring(string.empty);
        query["q"] = input.content;
        query["from"] = input.from;
        query["to"] = input.to;
        query["appid"] = input.appid;
        query["salt"] = input.salt;
        query["sign"] = input.sign;

        //构造uri,不建议直接拼字符串
        uribuilder uribur = new uribuilder("http://api.fanyi.baidu.com/api/trans/vip/translate");
        uribur.query = query.tostring();
        //uri会自动进行转义
        return uribur.uri;
    }

    /// <summary>
    /// 获取api返回的结果
    /// </summary>
    /// <param name="uri">请求的uri</param>
    /// <returns></returns>
    static async task<outputresult> getoutputresultasync(uri uri)
    {
        outputresult result = null;
        var response = await goodcontroller.httpclient.getstringasync(uri);
        var ser = new datacontractjsonserializer(typeof(outputresult));
        using (var ms = new memorystream(encoding.utf8.getbytes(response)))
        {
            result = (outputresult)ser.readobject(ms);
        }
        return result;
    }
}

个人认证后api的每秒请求量最高为10,此处使用同步方式获取翻译结果,有异步需求的可以自己更改。

应用:翻译halcon的示例描述

static void main(string[] args)
{
    xmldocument xd = new xmldocument();
    xd.load("index_examples_en_us.xml");
    //查找固定名称 节点名要从根节点开始写
    xmlnodelist nodelist = xd.documentelement.selectnodes("/examples/example/desc");
    for (int i = 0; i < nodelist.count; i++)
    {
        string desc = nodelist[i].innertext;
        //百度翻译有时不太准确,建议保留原文
        nodelist[i].innertext = translate.entozh(desc)+"("+ nodelist[i].innertext+")";               
        console.writeline("翻译结果"+i+":" + nodelist[i].innertext);
        console.writeline();
    }

    streamwriter sw = new streamwriter("index_examples_en_us_翻译.xml", false, new utf8encoding(false));
    //为了和原文件保存一致,原文件是使用的是"\n"换行
    sw.newline = "\n";
    xd.save(sw);
    sw.close();                  
    console.writeline("完成");
    console.read();
}

注:大概有1000多条需要翻译,需要等待10几分钟。考虑过使用特定字符组合成几个大字符串翻译后再拆分,但特定字符在翻译过程中有丢失导致拆分失败,只能使用这种方式。

将原halcon的xml文件重命名作为备份,将翻译后的文件复制到halcon程序目录下命名为index_examples_en_us.xml,效果如下:

到此这篇关于c#调用百度翻译实现翻译halcon的示例 的文章就介绍到这了,更多相关c# 翻译halcon内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!

(0)
上一篇 2022年3月23日
下一篇 2022年3月23日

相关推荐