查看: 4045|回復: 3
打印 上一主題 下一主題

視覺方程式與聽覺方程式的進化

[複製鏈接]

20

主題

91

帖子

0

積分

明德會員

Rank: 2

積分
0
跳轉到指定樓層
1#
發表於 2018-5-18 19:26:00 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

鎚子科技本次發佈了堅果R1旗艦手機和堅果TNT工作站,堅果R1手機採用了高通驍龍845處理器,總體表現並不遜色於市面上其他旗艦機,但是羅永浩對這款手機只是一筆帶過,只花了簡單幾頁PPT就講述完畢,沒有什麼有意思的語錄或段子,他把多數時間留給了堅果TNT工作站。

羅永浩賦予TNT工作站一個很響亮的稱號——“次世代計算平台”,是要重新定義了下一個十年的個人電腦。羅永浩將這款產品與蘋果公司在1984年推出的麥金托什電腦和在2007年推出的iPhone手機相提並論。

TNT工作站帶來了三種全新的交互方式:Touch and Talk、Crystal Ball以及Poker Dealer。

Touch and Talk,是在PC上按住某個區域說話,通過語音控制PC。比如按住Excel表格中的一個空格說出數字,系統會在空格中自動填入這一數字;你還可以通過語音控制PC上APP的打開和關閉等等。

Crystal Ball則可以自動排版PPT,Poker Dealer則可以通過語音直接進行搜索。除此之外,通過TNT工作站,你還可以雙手同時操作PC,實現多點觸控。

---------
堅果TNT工作站是很難得的創新,尤其是當PC被視為夕陽產業、全球廠商都在不思進取時,鎚子能在PC上帶來全新的交互方式尤為不易。不過,由於發佈會前羅永浩的持續吹牛,激起了大家極高的期望值,導致這款產品發佈後並沒有達到多數人的預期。

羅永浩在自己的微博
反覆反覆反覆反覆反覆強調
這次的發佈會是
“革命性、顛覆性的
甚至能改寫人類計算機的歷史”

啥叫TNT呢?
我智商有限,沒聽過啊!

人家老羅就說了
TNT 是 Touch & Talk 的縮寫
這次比較酷炫地使用了
觸控 + 語音結合的方式

只要按住屏幕說話
就可以開啟這個功能了
你要的打開文件、應用什麼的
統統幫你實現

這不,羅永浩還在現場
用這個功能發了條微博助力

但是呢,這個顛覆蘋果的新技術
在現場的展示過程中
給人印象最深的卻是
失誤
失誤
失誤
……
整個發佈會像是車禍現場。。

比方說,一開始
老羅想po個“微博”炫耀下
結果呢
老羅第一遍呼叫微博
沒反應

第二遍呼叫
還是沒反應
蛋蛋姐彷彿聽到了老羅內心的顫抖


好在第三次嘗試時
微博總算顯示了出來
尷尬的老羅滿頭大汗
不得不在現場高呼“理解萬歲”

本以為這個坎就這麼過去了
結果在做表格時
也不知道是老羅手抖
還是現場氣氛太嗨
剛開始前兩個數字
倒還算正常
老羅說個啥
表格上就顯示啥
可等到老羅一報“256”
Excel愣是沒反應

好不容易有反應了

觀眾們立馬明白了
原來老羅的工作站
區分不了“2”和“3”啊


不過老羅也沒當回事
一句“理解萬歲”後
接著報下一個數字
沒想到,當老羅報到“76”時
工作站上竟然破天荒的出現了
中文!!


接下來
不管老羅怎麼報數
Excel就像死機了一樣
愣是啥反應都沒有

別說是老羅了
就連一旁的蛋蛋姐
都止不住的尷尬

看著總是頻繁出錯的電腦
老羅滿臉的汗
順著脖子留下來
一旁產品經理的小眼神裡
也充滿了絶望


蛋蛋姐還瑟瑟發抖
萬一哪天
蛋蛋姐花大力氣做了個PPT
結果同事突然大聲來了句
“全部刪除”

也不知道被老闆開除後
老羅會不會看在我支援他產品的份上
給我碗飯吃啊

--------------
至於這款設備存在的意義,第一個問題,鎚子科技為什麼還要做電腦?羅永浩解釋說,VR/AR 這些至少還需要十年時間,我們目前還是需要電腦設備。所以我們決定引領這個十年。

尷尬的老羅又重新演示了一遍,這次終於成功了,從語音輸入,到“按住說話”的求和操作,TNT 功能的意義終於得到了展示。

接下來是 PPT,老羅介紹到,TNT 能戲劇性地提高工作效率。通過現場的演示來看,按住一組文字,可以通過語音來修改字號、顏色、字體等屬性。除了語音,還有一個實時顯示最終效果的滾輪。

接下來的各種演示同樣是基於“按住說話”這個邏輯,可以快速修改動畫等設置。

對於 TNT 的合理性,老羅總結為:“語音輸入指令對應的可能性太高,而指點則會把這種可能性大幅降低。”

當然,這個演示環節多少有點垮,羅永浩也向合作夥伴表達了歉意。

老羅不在乎這些,重點介紹了TNT的三大交互方式——Touch and talk(語音交互)、Crystal Ball(水晶球)、Poker Dealer(發牌手)。

TNT語音輸入什麼的,看似十分戳中效率痛點,卻直接忽略了應用場景:

想用TNT ,你要有個好嗓子,說一天都不會啞!

你還要有個私人辦公室,說一天也不會挨打!

----------
再回到“重新定義”上,老羅將語音輸入作為人機交互的首要入口,這幾乎是一個拍腦袋的設想。

很難想像,未來的辦公室將會成為一個話務室——人們都需要用語音指令來辦公或者娛樂。不可否認,從現在來看,語音輸入比鍵盤打字會有更高的效率,我們甚至可以設想在未來,語音的識別率可以達到100%,但你真的會在辦公室對著Office喊“給我複製第三段”“給我粘貼那張圖”嗎?


20

主題

91

帖子

0

積分

明德會員

Rank: 2

積分
0
2#
 樓主| 發表於 2018-5-18 19:27:13 | 只看該作者

1 效率進化導致不同發展

從上面文章可以驗證,單純的聽覺方程式是很難獨立執行電腦操作的,那麼為什麼人類進化歷史中,中國的甲骨文漢字,視覺方程式,受到了重創,甚至被認為是落後的文字,文明?

以前的人們,都是部落生活,所處的環境,見到的人,物,所要表達的事情,故事,都是數據流較小的,所以視覺方程式,從數據流,效率,完全可以滿足人類需求

隨著部落人群的融合,科技交流商業等的進步,需要更有效率的方程式,聽覺方程式更有效率,容納更多數據流

我三分鐘可以講一個完整故事,時間空間人物情節等等,
可是寫的話,能夠寫幾個字?太沒有效率了
這個應該是全世界民族,慢慢都進化為聽覺方程式為主的文明,最重要的因素!

2  視覺方程式與聽覺方程式最大的不同

方程式都是時空法則的體現,是對自己所處環境,所感覺事物,成住壞空的一種表達,或者一種情緒的流露

不同的是聽覺方程式的優點是效率,容納量很大,但相應 錯誤率也高
視覺方程式最大優點是準確率極高
比如白紙黑字,白紙黑字是一個漢語成語,意思是指白紙上寫的黑字,指見於書面的確鑿的證據

【詞目】耳聽為虛,眼見為實
【釋義】形容不要輕信傳聞,看到的才是事實。聽來的傳聞是靠不住的,親眼看到才算是真實的。謂親眼看見的比聽說的要真實可靠

現在網絡流行語,無圖無真相,是2009年在網絡論壇、網絡社區上非常流行的一句話。其字面意思是指:沒有圖片就不能清楚瞭解事情的真相。

為什麼如此?
是因為視覺方程式自帶三維空間概念,給人較為直觀的印象
而聽覺方程式,接收者需要自行想像還原為三維數據流,相應 錯誤率也高


3  視覺方程式與聽覺方程式的本質

本質都是傳遞,還原講述者自己對所處環境,所感覺事物,成住壞空的一種表達,或者一種情緒的流露

舉例,蝙蝠視力極度退化

蝙蝠當然有眼睛,只可惜它是高度近視眼,視力極差,基本看不見東西。因此,它只好發出超聲波,用回聲進行定位。雷達就是模擬蝙蝠的定位方式發明的。

回聲進行定位,就是對事物的三維數據,空間法則的構建,可見聽覺方程式很難獨立運行。

據此推論,現在語音人機交互,是困難重重
而且人工智能,科技技術,往往是對人類生命的模仿而已,沒有超越突破

人類對聽覺方程式現在怎麼進化處理?
一個是篩選,過濾大部分的雜音,但是往往主觀,忽略一些東西,比如你教室50人都在讀書,你讀書思考,不主觀忽略一定會瘋的

一個是輔助,比如電影,演唱會,用眼睛等輔助數據

4  其實電影藝術的發展就是最好的人類感知進化史

從靜止的進化為運動的,從2d進化為3d,從黑白到彩色,從無聲電影到立體聲
,現在我們進電影院,還是認為畫面是最重要的


20

主題

91

帖子

0

積分

明德會員

Rank: 2

積分
0
3#
 樓主| 發表於 2018-5-18 19:29:14 | 只看該作者

視覺與聽覺的「咸甜豆腐腦」之爭,測測你屬於哪一派

最近全體美國人快要被這段語音給弄瘋了。其實就是念了一個英文單詞,問題在於,同一段語音,有人聽到的是Yanny,有人聽到的是Laurel,網友們爭吵不休也無法達成共識。
你聽到的是Yanny還是Laurel?

-------------
這次最大的收穫,是發現先生一個小失誤。
先生以前講視覺漢字,容易引發妄想,所以被聽覺方程式,慢慢取代。

現在看,視覺方程式與聽覺方程式,都會引發妄想。
那麼妄想的本質是什麼?
人類大腦執行程序方程式,不管腦力,體力。都需要閉環的,標準模式的運行

如果看到的聽到的,五感感知到的數據不足的話,必須腦補以前的數據填充,否則方程式不成立,會宕機的

所以妄想,本質是大腦的自我保護,自我補足



214

主題

2118

帖子

0

積分

明德會員

Rank: 2

積分
0
4#
發表於 2018-5-19 08:51:36 | 只看該作者
李昊 發表於 2018-5-18 19:29
視覺與聽覺的「咸甜豆腐腦」之爭,測測你屬於哪一派

最近全體美國人快要被這段語音給弄瘋了。其實就是念 ...

很有見地!感恩分享。借此機緣就余之理解略作表述。

人類存在之意義即處理信息,而信息之輸入不外乎兩種:視、聽。有人說身體對外部刺激如“溫度、刺壓”等做出的反應亦是信息接收,余以為雖屬於信息處理,但,其充其量是本能反應。何為本能反應?即信息處理不具多樣性的定向處理。然,視、聽信息則不同,會經大腦產生無窮多的處理結果進而形成特殊的意識狀態。於此,想要強調“意識”是實體,並非虛無。


語音操作科技像是人類科技發展中的搞笑版,只是一個小片段而已。聽覺方程是對視覺方程的弱化,而視覺方程則是對知覺方程的弱化。


討論甲骨文是否是落後文化,就像猴子們討論一台收音機發出的聲音(廣播)是否有意義。


世界不簡單,諸位能於此討論亦不簡單。
*滑动验证:
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

快速回復 返回頂部 返回列表