设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 11222|回复: 52
打印 上一主题 下一主题

[科普知识] 语音识别漫话

    [复制链接]
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    跳转到指定楼层
    楼主
    发表于 2011-6-23 13:14:46 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
    第一章
    . V$ ]0 O  E, s( d* U
    随便聊聊语言和语音$ k7 B" d4 g8 M+ s+ M

    5 f; s, c9 U2 ^+ N/ n! K! w0 M
    语言是什么,语音又是什么?各个百科书上的定义不尽相同,又大致没什么明显差异。
    ; q  m' |! c# D0 c. \% u
    举语言为例,百度百科如是讲:“语言是思维工具和交际工具。它同思维有密切的联系,是思维的载体和物质外壳和表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。”

    ' z" b( [/ y8 P0 Z
    维基上则这样讲:“语言是一套共同采用的沟通符号、表达方式与处理规则。符号会以视觉、声音或者触觉方式来传递。”

    0 N/ d1 Y0 `% R+ D+ u7 h
    而互动百科上说:由于研究方法和角度的不同,人们对语言的定义多种多样。有代表性的说法就有几十种。
    2 k2 A2 J  V9 Y
    无论如何,语言是人类创造的,用以承载和传递信息的工具。这个对于语言作为工具性描述的定义,包括人类创造的非自然语言(如世界语)和机器语言,也都符合要求。虽然,这个定义没能涵盖语言的其他功能。
    1 t& ~' s7 V0 |# p3 Q
    语言是怎样起源的?现在没人说的清楚。中国的古代文献里只提到仓颉造字,也不知有没有文献里记载语音的产生或者探讨语音的产生。我不是这方面的专家,还请老丁,太傅,张王,虎老师,江城等诸位国学深厚的大拿说说。至于西方,也并无类似记载。有记载的唯有中东的古埃及时代。

    7 @+ ]8 |. Y' z6 t2 l4 w* [/ O: E
    在古希腊史学家希罗多德的《希波战争史》的上卷曾记载有这样一个故事:公元前6世纪古埃及努比亚王朝那个驱逐了亚述占领而复国的名叫萨姆提克一世(或者几世)的法老,他很想知道哪种语言是世界上最古老的语言,于是就把两个初生的婴儿送到与世隔绝的地方喂养,严禁任何人在他们面前交谈。两年后的一个早晨,这两个孩子突然手舞足蹈地喊出了“biex”这个词。法老派人查访后,发现腓尼基语中有发音和这个接近的词,意思是面包。于是法老就宣称腓尼基语是世界上最古老的语言。如果这个故事是真的,那它告诉我们,古埃及人对语言 的起源问题很早就有兴趣,并用他们想当然的方法进行了有趣的探索(岑麒祥,1985)。希罗多德的下卷记录希波战争很是确切,但是上卷类似随笔,记载各地风土人情,传闻轶事,所以这个我以为算是孤证,因为这件事距离他本人也有近百年了。
    . H5 J3 Z. r" i; U4 e
    从两千多年前的法老到十九世纪,各种关于语言起源的理论非常多。比如有人认为语言起源于原始人劳动时发出的声音(唷,希呵理论);或模仿大自然的声音慢慢建立语言(叮当理论);还有认为是模仿动物的叫声开始的(Bow wow理论)。这些理论多数没有什么科学价值,也就是把科学的东西和宗教,哲学的混在了一起,而且在方法上也是用哲学方法推测,不是科学方法实践。这些说法都是不可能有反证的,因此也没有被证明的可能性(王士元,彭刚,2006)。几百年来许多哲学家和语言学家耗费大量精力来研究这个问题,事实上倒是阻碍了语言学的进展。结果1866年法国语言协会订立了一条规则,不接受有关语言起源的报告和文章,此后多个语言协会也订了类似的规则。结果,此后100多年,没展开过什么语言问题起源的讨论。
    6 [! f% I- {, x3 Z
    下面说说语音。

    评分

    参与人数 3爱元 +15 捐资 +2 学识 +1 收起 理由
    煮酒正熟 + 5 + 2 + 1
    万里风中虎 + 5 欢迎老燕
    海天 + 5

    查看全部评分

  • TA的每日心情
    无聊
    2018-4-11 17:43
  • 签到天数: 497 天

    [LV.9]渡劫

    54#
    发表于 2012-5-1 20:30:45 | 只看该作者
    燕庐敕 发表于 2011-6-24 08:55
    . N# b- w4 z0 m1 D3 E* E回复 Radiohead 的帖子5 Y; t% y0 f4 E
    - P, ?; r& L; e
    李开复在真实意义上,就是用统计学实现语音识别的第一个成功实践者。 ...

    / z" s9 |/ Q0 }* t! E9 {有幸参加过当年微软Vista的语音测试项目 早期名叫做Hoolie 就是大家现在能在Vista 和 Win7上面能看到的自带的Windows语音识别 这个项目的最高负责人当然就是李开复了

    点评

    牛人  发表于 2012-5-10 21:46

    该用户从未签到

    53#
    发表于 2012-4-15 21:28:46 | 只看该作者
    明月回春 发表于 2011-12-6 21:30 # w$ w: {8 `: }/ [1 G
    总觉得语音识别和输入法的内核几乎是一样的。只不过语音还要先把自然音转变成数字信号。内部都是隐含马尔科 ...
    " P$ ]8 t, P' y- u9 X8 d
    CMU 的 Sphinx原来是李开复开发的呀,这个库到现在好像还在更新,没想到居然有这么久的历史。
    8 [/ c& M; G- r; F$ p: ^7 xhidden Markov model(HMM)在gesture recognition(动作识别?)领域也得到广泛应用,而且很多算法用的框架就是语音识别移植过来的。最近在看这个,数学不好,看得很晕。
    5 |6 r5 B9 t" e6 x9 O9 n静候下文。
  • TA的每日心情
    开心
    2016-5-13 20:21
  • 签到天数: 1 天

    [LV.1]炼气

    52#
    发表于 2012-3-27 12:15:11 | 只看该作者
    燕庐敕 发表于 2012-3-7 17:17
    0 j+ _8 U" ^# M. D我现在还没稳定下来,还在找工作,诸位可不可以有点同情心,同理心?! ...

    0 K5 @3 O1 R) v2 }, ]9 `: l9 T; o转眼又是20天啊,不知兄长工作找的如何了?可有满意工作?。。。呼唤填坑,一月份做的语音识别的行业投资分析都快结项了。。。

    该用户从未签到

    51#
    发表于 2012-3-9 17:27:11 | 只看该作者
    燕庐敕 发表于 2012-3-7 17:17 " {$ G4 I+ ~7 y% L, ]+ w( O* l
    我现在还没稳定下来,还在找工作,诸位可不可以有点同情心,同理心?! ...

    ! T4 e6 _: w5 m+ V' H2 V9 e2 Z" `请您慢慢填坑,别忘了就成。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    50#
     楼主| 发表于 2012-3-7 17:17:29 | 只看该作者
    就爱抬杠 发表于 2012-3-7 17:15 * q! {0 p, t9 B. _# e* M
    啥时有下文?等得花儿也谢了

    / z1 v0 `4 R. B4 U我现在还没稳定下来,还在找工作,诸位可不可以有点同情心,同理心?!
  • TA的每日心情
    慵懒
    2019-4-30 09:37
  • 签到天数: 532 天

    [LV.9]渡劫

    49#
    发表于 2012-3-7 17:15:27 | 只看该作者
    啥时有下文?等得花儿也谢了
  • TA的每日心情
    擦汗
    2023-7-7 20:03
  • 签到天数: 525 天

    [LV.9]渡劫

    48#
    发表于 2012-3-5 23:38:04 | 只看该作者
    其实以前用的语音输入很好,虽然开始错误多,慢慢软件习惯了口音之后就快多了,可不知道为什么,后来就没人用了
  • TA的每日心情
    开心
    2018-3-26 13:42
  • 签到天数: 11 天

    [LV.3]辟谷

    47#
    发表于 2012-2-9 00:02:41 | 只看该作者
    ibm曾经出过一个via voice,有用过的大侠么?给评价评价?

    点评

    在他家电脑上把论文录入了,别提后来多痛苦了,为了校对甚至又花了10块钱买了盗版黑马校对,结果20块钱都白花了  发表于 2012-6-23 18:59
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    46#
     楼主| 发表于 2012-1-19 23:18:55 | 只看该作者
    茉莉 发表于 2012-1-19 23:11
    - f6 d9 ]" Q7 y0 P! @( _甚麼時候有下文?期待

    : `: u* }1 g$ x5 L# F3 V7 x7 ]! d& M我也不知道。

    点评

    挖坑要趕快填呀@_@  发表于 2012-1-19 23:20
  • TA的每日心情
    开心
    2018-12-23 03:44
  • 签到天数: 210 天

    [LV.7]分神

    45#
    发表于 2012-1-19 23:11:53 | 只看该作者
    甚麼時候有下文?期待

    点评

    我和鲶鱼学的,坑品越来越差。  发表于 2012-1-19 23:23
  • TA的每日心情
    慵懒
    2019-1-26 20:50
  • 签到天数: 575 天

    [LV.9]渡劫

    44#
    发表于 2012-1-10 17:32:12 | 只看该作者
    等了好久老不见下文,等老兄手头事都处理好,闲的无聊时写写?
  • TA的每日心情
    奋斗
    2019-7-10 21:18
  • 签到天数: 17 天

    [LV.4]金丹

    43#
    发表于 2011-12-26 17:23:02 | 只看该作者
    搬小班凳期待,进入这行也有些年头了,很想看看别人眼中的语音业界

    该用户从未签到

    42#
    发表于 2011-12-23 09:54:17 | 只看该作者
    很有兴趣读,等着下一章。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    41#
     楼主| 发表于 2011-12-23 08:43:12 | 只看该作者
    洗心 发表于 2011-12-23 04:44
    0 t& u9 e+ s8 K  u9 _( H; J# h9 Q这个是师兄的老本行啊。
    & P* P2 u; X3 A# G2 B1 b5 K& Z$ \  k$ n
    一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什 ...

    ' s7 t, `+ D1 [2 i6 h% t师妹,这个真不是我的老本行,是家里领导的。我算是没吃过猪肉,看了20多年猪跑吧。
    - w8 ~! {# Z# |/ m
      }/ I1 f6 l; ~, C具体的,面向个人的汉语语音识别软件,我还是回家问一下你师姐吧。
  • TA的每日心情
    奋斗
    2020-9-22 02:23
  • 签到天数: 754 天

    [LV.10]大乘

    40#
    发表于 2011-12-23 04:44:52 | 只看该作者
    这个是师兄的老本行啊。
    / M2 d2 r1 z) ^, ?) @$ s) g
    ) \5 [3 `. J$ d$ B3 \% ]一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什么好推荐的?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    39#
     楼主| 发表于 2011-12-22 15:54:05 | 只看该作者
    PenPen 发表于 2011-12-22 15:42
    5 [) [# C2 j: Y; a2 R. x$ f' k- Z研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了 ...

    $ y: Y+ b) u0 j4 O这个么,应该问张亚勤,不是问我。

    该用户从未签到

    38#
    发表于 2011-12-22 15:42:39 | 只看该作者
    燕庐敕 发表于 2011-12-16 22:42
    % n7 A' I1 o) f  M/ |6 N" T微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    6 b4 U% R  |6 P6 V8 J0 D
    . x. L. Z' C' s ...

    5 b; i( r7 J4 H2 e* f& C* S研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了
  • TA的每日心情
    无聊
    2018-9-28 19:44
  • 签到天数: 1 天

    [LV.1]炼气

    37#
    发表于 2011-12-22 13:56:51 | 只看该作者
    燕庐敕 发表于 2011-12-16 22:42 , |" C& N, E7 E
    微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    + U3 o$ x( c, N& N+ K7 F8 `2 ~) c- g! G, A7 a! q3 B
    ...
    . ^& ]+ g( X- A0 o# ?
    等待戈多,  哈哈,不是了,  等着下面...狐狸的那个精油帖明显没有你的技术难度高...

    点评

    多谢理解,哇哇大哭。  发表于 2011-12-22 14:23
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    36#
     楼主| 发表于 2011-12-16 22:42:21 | 只看该作者
    包子 发表于 2011-12-16 21:11
    4 C! U3 @* {* k8 m/ h上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛! ...
    + ?# Q7 d7 N. f- o+ k8 A$ H
    微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    # X3 E! {: x/ S! q( G% ^  ]9 N1 |5 Y2 b" ~# p
    当今技术大概算第二吧。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-6-6 02:49 , Processed in 0.050041 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表