设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕
打印 上一主题 下一主题

[科普知识] 语音识别漫话

    [复制链接]
  • TA的每日心情
    慵懒
    2016-11-23 16:33
  • 签到天数: 14 天

    [LV.3]辟谷

    21#
    发表于 2011-6-27 12:59:26 | 只看该作者
    等着看语音啊
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    22#
     楼主| 发表于 2011-6-27 16:32:10 | 只看该作者
    回复 暗夜雪武 的帖子3 \5 [; F, K- J! G& V
    : ~; J* Y5 |- d6 a
    没写好呢,慢慢来。

    点评

    慢慢写  发表于 2011-6-27 16:33
  • TA的每日心情
    郁闷
    2019-4-22 08:49
  • 签到天数: 38 天

    [LV.5]元婴

    23#
    发表于 2011-6-29 08:26:18 | 只看该作者
    回复 燕庐敕 的帖子* n8 B4 e5 Y% w+ w

    7 ?' ]5 |2 p$ v$ j深入的不知道,微软的语音识别现在已经很好了,据我所知有相当部分的项目已经进入工程阶段,从研究院转了出来。上次看了他们的私下展示,似乎搞研究的那帮人正在攻克中文的方言,反正在云上跑的服务对新闻类节目识别率已经接近完美了,现在的问题似乎是性能不行达不到接近实时的级别,要用几倍的时间。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    24#
     楼主| 发表于 2011-6-29 09:18:13 | 只看该作者
    本帖最后由 燕庐敕 于 2011-12-2 21:31 编辑
    8 o9 E6 b/ w/ ]% `- v+ n, v3 m
    ( _+ H( T- l6 h$ M) Q回复 定风波 的帖子
    / m/ q1 O- a6 U* L1 U: M* o+ _) W3 C4 F' e6 M
    微软收购Dragon之后在语音方面确实进展很大。( n' n7 `: k: X
    # I0 J3 e( L- b4 W* h# H+ g! S
    当今最好的是合并了野火之后的Nuance,他们的英语语音识别已经商用化多年。  A, p2 U( _% u/ F  @
    6 s2 S$ b7 Y0 E5 Z# Q
    国内他们也进入十年了,主要是和华为这些方案商合作,卖端口。9 S( t  ^0 X. E1 k# R5 T1 m

    2 d' \4 _! ~+ T% n3 X现在也力图与银行机场等合作。遇到的最大对手是科大讯飞。
    ! L) e/ C9 e/ K* D
    ) k" q, ~9 ~4 E; w5 V, [  f' x- C方言与普通话或者英语或者其他什么人的语言在实现上没什么区别。最主要就是大字表和字库的训练,还有句子/词的切分。训练的越多自然效果越好

    点评

    确实是这样,不然也不会进入工程化阶段,进入工程化意味着已经没有什么重大的paper可以在3,2年内发出了,应用也就开始定型.  发表于 2011-6-29 10:53

    该用户从未签到

    25#
    发表于 2011-11-25 18:58:19 | 只看该作者
    支持下。。。。。。。。。。。。

    该用户从未签到

    26#
    发表于 2011-11-26 00:12:51 | 只看该作者
    老兄,这个太好了,谢谢。

    该用户从未签到

    27#
    发表于 2011-11-28 09:24:07 | 只看该作者
    长见识 唯一的一名游学生回帖 有点害羞啊

    该用户从未签到

    28#
    发表于 2011-12-2 18:32:24 | 只看该作者
    当这两个月看足了SIRI的神奇,再回来读老燕的文章,格外有趣。

    该用户从未签到

    29#
    发表于 2011-12-5 01:57:59 | 只看该作者
    下面呢?

    点评

    同问。  发表于 2011-12-8 10:15
    你除了这个,不会问别的?哈哈。  发表于 2011-12-5 08:44
  • TA的每日心情
    慵懒
    2019-4-23 23:43
  • 签到天数: 25 天

    [LV.4]金丹

    30#
    发表于 2011-12-6 20:20:22 | 只看该作者
    电子技术的突飞猛进,将庞大的数据基于云的快速检索~实验室还是相当可行的
    + E# z* j( p- i& r) o) x& o# p5 \现在更重要的无线传输的问题,利润的问题
  • TA的每日心情
    慵懒
    2019-6-5 13:01
  • 签到天数: 115 天

    [LV.6]出窍

    31#
    发表于 2011-12-6 21:30:16 | 只看该作者
    总觉得语音识别和输入法的内核几乎是一样的。只不过语音还要先把自然音转变成数字信号。内部都是隐含马尔科夫链。真正的先驱应该是IBM 的 Fred Jelinek (贾里尼克)和卡内基·梅隆大学的 Jim and Janet Baker (贝克夫妇,李开复的师兄师姐) 。他们分别独立地提出用隐含马尔可夫模型来识别语音,语音识别的错误率相比人工智能和模式匹配等方法降低了三倍 (从 30% 到 10%)。。八十年代李开复博士坚持采用隐含马尔可夫模型的框架, 成功地开发了世界上第一个大词汇量连续语音识别系统 Sphinx。

    点评

    接着写啊  发表于 2011-12-6 22:02
    正确的表述是“隐马尔可夫过程”。  发表于 2011-12-6 21:51
  • TA的每日心情
    奋斗
    2019-5-3 10:48
  • 签到天数: 771 天

    [LV.10]大乘

    32#
    发表于 2011-12-16 05:40:15 | 只看该作者
    哇!终于动工啦?这可是个计划已久,光光预告就出了三四次的大作呢。期待期待,搬个小马扎坐下听讲
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    33#
     楼主| 发表于 2011-12-16 11:40:11 | 只看该作者
    抱朴仙人 发表于 2011-12-16 05:40
    % M. C5 m9 |, B' `哇!终于动工啦?这可是个计划已久,光光预告就出了三四次的大作呢。期待期待,搬个小马扎坐下听讲 ...
    5 X7 p7 A& Q" w) D% r3 ~& [
    就是您老和雪太傅的那个“文科生也要能看懂”的光辉指示,害苦了俺也~~~~

    点评

    俺在河里就是有名的文科生呢,我都看不懂怎么行呢?嘻嘻  发表于 2011-12-16 14:15
  • TA的每日心情
    慵懒
    2018-6-2 22:44
  • 签到天数: 16 天

    [LV.4]金丹

    34#
    发表于 2011-12-16 21:11:29 | 只看该作者
    上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛!
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    35#
     楼主| 发表于 2011-12-16 22:42:21 | 只看该作者
    包子 发表于 2011-12-16 21:11
    ; {+ l. ?3 T; Z% T/ |' U上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛! ...

    . Y: y2 O% J. C0 H% m2 v9 ~" g微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    ( B. U& I9 u2 q/ L3 ]
    ; b. D0 f4 y  O% n* s+ ?/ Z5 c2 h当今技术大概算第二吧。
  • TA的每日心情
    无聊
    2018-9-28 19:44
  • 签到天数: 1 天

    [LV.1]炼气

    36#
    发表于 2011-12-22 13:56:51 | 只看该作者
    燕庐敕 发表于 2011-12-16 22:42 9 w; R" ^/ h, i3 W: V: A7 ?
    微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。" e' T1 X: Q3 _/ C
    2 `) _- W3 }4 y6 M1 F, V+ P; k
    ...

    0 S% V$ t4 ^& D$ c! X; s" E1 [4 N等待戈多,  哈哈,不是了,  等着下面...狐狸的那个精油帖明显没有你的技术难度高...

    点评

    多谢理解,哇哇大哭。  发表于 2011-12-22 14:23

    该用户从未签到

    37#
    发表于 2011-12-22 15:42:39 | 只看该作者
    燕庐敕 发表于 2011-12-16 22:42
    + }. N) h: C1 E& Q, T5 _微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    0 k+ \! U8 B* F% J/ R4 [1 s+ m+ j; Q9 o. t, i# \, ~
    ...

    9 i( Y6 X8 E& p# u2 s研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    38#
     楼主| 发表于 2011-12-22 15:54:05 | 只看该作者
    PenPen 发表于 2011-12-22 15:42 6 p1 t" }1 l' S6 P( ?! C6 a& \/ L
    研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了 ...
      `4 F* ~; |3 X; b/ C
    这个么,应该问张亚勤,不是问我。
  • TA的每日心情
    奋斗
    2020-9-22 02:23
  • 签到天数: 754 天

    [LV.10]大乘

    39#
    发表于 2011-12-23 04:44:52 | 只看该作者
    这个是师兄的老本行啊。% G  y: _- X) l, v7 T7 ?" K
    ; B8 v2 X- }9 a$ q* C2 X/ n0 A
    一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什么好推荐的?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    40#
     楼主| 发表于 2011-12-23 08:43:12 | 只看该作者
    洗心 发表于 2011-12-23 04:44
    2 T$ M- t" p( p6 D: U这个是师兄的老本行啊。. N0 e) B1 L; |, s/ u
    9 l2 |8 B# t) i
    一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什 ...
    1 r2 w& B6 R, t; n* y
    师妹,这个真不是我的老本行,是家里领导的。我算是没吃过猪肉,看了20多年猪跑吧。, B: L2 O" X* o& R  m& S8 a# V; p
    2 G) W" F/ `/ E3 h
    具体的,面向个人的汉语语音识别软件,我还是回家问一下你师姐吧。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-1-19 20:16 , Processed in 0.043775 second(s), 17 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表