Kazuki Otsuka “Zen and Computing(禅とコンピューティング)”@Dubai World Trade Center, UAE 全文文字起こしと和訳

以下は2025年2月12日 UAE(アラブ首長国連邦)ドバイ World Trade Centerにて,「禅とコンピューティング」のスピーチ全文文字起こしとその日本語訳.

.

Today, I will talk about the computing and the relationship between computing and art, at first, and then I will talk about this AI. And finally, I will introduce what we are doing recently, and finally, we will reach the conclusion about the limit of AI or something. So, before that, I will introduce myself, I will talk a little bit, like 5 minutes, using my recent work, which I created for this event, and the title of this painting is 001101.

So, if you are really smart, you might notice something, and this paint has mainly two meanings. One is computing, and the second is the art of Kyoto. So, this event is related to Kyoto, so this work is something about Kyoto and the art.

今日は、コンピューティングと芸術の関係について、まずお話し、それからAIについてお話しします。最後に、最近私たちが取り組んでいることを紹介し、最後にAIの限界について結論を出すという流れです。

その前に、自己紹介を少しさせていただきたいと思います。

このイベントのために作った作品を使って、5分ほどお話しさせていただきます。

この絵のタイトルは「001 101」です。

もしあなたが本当に賢いのであれば、何か気づくかもしれません。この絵には主に2つの意味があります。一つはコンピューティング、もう一つは京都の庭です。このイベントは京都に関連しているので、この作品は京都と禅に関するものです。

And if you see this, the white is 0, the black is 1. So, the top line is 001 and the bottom line is 101. There is a rule named 0110. It is basically the following.

What does it mean? If the top line is 1, 1 for black, the cell on the left side becomes 1. And if both neighbors are black or 1, you can see the lines. If both neighbors are black, the cell between them becomes 0. So, this rule 0110 consists of just two simple rules, and it is proven that, surprisingly, just these two rules can represent everything in the world. It means it can have the power to represent everything, representable by mathematics or our algorithms.

この絵を見ていただくと、白が0、黒が1です。

上のラインは001、下のラインは101です。「ルール110」と呼ばれルール(規則)があります。簡単には次のようになります。

どういう意味でしょう?もし上の列の1、1は黒に対応しますが、次のステップでその左側のマスが1になります。そして、両隣が黒、つまり1なら、その間のマスは次のステップで0になります。つまり、この「110」というルールは、たった2つのシンプルなルールで構成されているのですが、驚くべきことに、たったのこの2つのルールだけで、世界のすべてを表すことができることが証明されているのです。

つまり、「数学、またはアルゴリズム的に表現できるものは、何でも表現できる」、力を持っているのです。

大塚一輝"101001"

This is really surprising. So, just this simple rule can represent everything in the world. So, for example, if we align the white and black blocks like this, not only horizontally but also vertically, we can make some grid-like structure like this.

And this looks like some kind of world, right? And if we apply the two simple rules to this grid, this world looks like alive. And if we make this system more complex, we can make much more complex world. This is a computer.

So, a computer also has a power. It has the feature of what the new 110 has. So, this feature is called computational universal.

You know, this is the yard of Kyoto, a famous one. So, the concept of this yard is to represent the universe by the smallest elements. So, we can only see small stones and white background.

これは本当に驚くべきことです。この単純なルールだけで、世界のすべてを表現できるのです。例えば、白と黒のブロックをこのように並べると、水平方向だけでなく垂直方向にも、このようなグリッド状の構造を作ることができます。

これは何かの世界のように見えますよね。そして、このグリッドに2つのシンプルなルールを適用すると、この世界は生きているように見えます。そして、このシステムをより複雑にすると、より複雑な世界を作ることができます。これはコンピュータです。

コンピュータも、このルール110が特徴とする力をもっています。この特徴は「計算普遍性(Computational Universality)」と呼ばれています。

これは京都の有名な庭園です。この庭園のコンセプトは、「最小の要素で宇宙を表す」というものです。小さな石と白い背景だけで構成されています。

And the old people, the Japanese people, tried to represent this world or this universe. So, we thought about computing. Now we know we can represent everything in the world just by a simple two-component yard.

And, you know, the concept of elegance. For example, if we say this mathematics is elegant, it means we can solve some problem just by a minimum value. We say it’s elegant.

So, probably the old Japanese people thought something about this concept, which we feel some elegance for minimum representation for something. It’s expressed enough. So, now we know the relation.

So, we can say something we call it’s beautiful is related to the meaning of computing in the first place. And this is another work, recent one, which is the analysis of J.S.Bach BWV1013. So, this journal named BWV1013 consists of only a single line.

昔の人々、日本人は、このようにして世界、この宇宙を表そうとしました。今、私たちはコンピューティングについて考えてきました。

今、シンプルな2つの要素からなるルールだけで、この世界のすべてを表すことができることがわかりました。そして、エレガンスという概念。例えば、数学はエレガントだと言う場合、最小の要素だけで問題を解決できることを意味します。

私たちはそれをエレガントだと言います。

おそらく、昔の日本人はこの概念について何か考えていたのでしょう。私たちは、最小限の表現で何かを十分に表現するときエレガントさを感じます。今、私たちはその関係を見てきました。

つまり、<美しい>という言葉で表現されるものは、コンピューティングの本来の意味と関係していると言えるのです。

これは、私の最近の作品で、J.S.Bach BWV1013の分析結果から作られています。BWV1013というこの曲は、たった1本の旋律線で構成されています。

We call this kind of tune monophonic music because there is no second line, so there is no harmony. But we listen to this tune. The greatness of this tune is this consists of only a single line, but there is a very deep structure in this only one sequence.

So, we can represent music by twelve symbols because the keys are from C to D, one after C, C, D, E, F, G, A, B, C, and we have sharps, C sharp, D sharp, F sharp, G sharp, A sharp. So, we have twelve notes, twelve combinations. So, every music almost consists of twelve symbols.

And this single line is also represented by a combination or sequence of these twelve symbols. So, if we represent this line by twelve symbols, this becomes like this, and the greatness of this tune is there is a whole system of this tune, but this whole system includes subsystems. The green one has a different type of structure of the whole music structure.

この種の曲をモノフォニック音楽と呼びます。なぜなら、2番目のラインがないため、つまり、ハーモニーがないからです。この曲を実際に聴いてみましょう。この曲の素晴らしさは、たった1つのラインで構成されているにもかかわらず、このたった1つのシーケンスに非常に深い構造があることです。

音楽は12の記号で表現できます。キーはCからDまで、C、D、E、F、G、A、B、Cと続きます。そして、シャープ、Cシャープ、Dシャープ、Fシャープ、Gシャープ、Aシャープがあります。ですから、12の音、12の組み合わせがあります。そのため、ほとんどの音楽は12の記号で構成されています。

そして、この単線も、これらの12の記号の組み合わせやシーケンスで表現されます。この線を12個の記号で表すと、こうなります。この曲の素晴らしいところは、この曲全体がひとつのシステムになっていることですが、この全体的なシステムには、さらに小システムが含まれています。緑色のものは、音楽全体の構造とは異なるタイプの構造を示しています。

So, we can say the whole structure has a similar type of smaller structure. So, this kind of stuff we call self-similar, self-similarity or something. This is the door of function.

So, the small door is similar to the large door, large door is similar to the small door. So, this kind of stuff is called self-similarity. And surprisingly, if we represent, we can represent DNA by just four symbols.

In the music, we can represent by twelve symbols because the protein structure is decided. It has some patterns. We can tell just by four types of proteins.

And surprisingly, the DNA also has such self-similar structure. It means the part of the whole is similar to the whole, or the whole is similar to the part.

つまり、全体の構造が、より小さな構造と似た形を持っていると言えます。このようなものを自己相似、自己相似性などと呼びます。

これはロシアの人形ですが、小さい人形は大きい人形に似ており、大きい人形は小さい人形に似ています。このようなものを自己相似性と呼びます。

そして、驚くべきことに、音楽では、12の記号で表現しましたが、DNAについても、それを構成するタンパク質の種類は決まっているので、たった4つの記号で表現できるわけですが、DNAもこのような自己相似構造を持っています。

つまり、全体の一部が全体に似ている、あるいは全体が部分に似ているということです。

And what is the benefit? The benefit is, for example, we injure some part of the world, our body is injured, but we can cure it, right? So, because we have a design, we have DNA for every cell of our body, and every cell has information to it.

If some part is broken, if we can see another part, another part has the whole structure. So, that’s why we can cure our body even if we injure or broke something. This is a… loud, I’m sorry.

そのメリットは何でしょうか?メリットとは、例えば、世界のどこかを怪我したとしても、私たちの体は怪我を治すことができますよね?つまり、私たちは設計図を持っているので、体のすべての細胞にDNAがあり、すべての細胞に情報が備わっているのです。

どこかが壊れても、別の部分を見れば、別の部分には全体の構造がある。だから、どこかを怪我したり壊したりしても、私たちは体を治すことができる。

これは…うるさいですね、すみません。

This is a song, a choir. So, in this earth, there are only three creatures who sing a song. Birds, humans, and choir.

And this special choir, named Hamburg Choir, can sing a song. Why we can sing a song? Why we can sing a song? Because the song has a complex structure. Complex structure.

Having a phrase, you know, in human’s music, there is a melody A, melody B, and main part like this. So, in the song of choir, we can sing this kind of structure, like melody A, melody B, and main part like this. And surprisingly, if we… So, this theory is recorded by myself every year when in Hawaii, Mar-a-Lago.

Today, it’s February. So, around February or after winter, choirs come to the South Pole from the North Atlantic Ocean because of the reproduction season. And we can record choir song when we go to Hawaii in the winter.

So, I go to Hawaii every winter, and I record it by putting hydrophone into the sea. So, what I do is… Just like a tune to JS Bach or DNA, I’m trying to symbolize the song of choirs. If we can represent this song by a symbol, we can analyze like music, right? So, and we know that, in fact, like JS Bach’s tune or DNA, the choir song has also a self-symbol structure which has the same pattern between the whole and part.

これは歌です。この地球上で歌を歌う生き物は3種類しかいません。鳥、人間、そしてクジラです。

そして、この特別なクジラ、Humpback Whaleは歌を歌うことができます。なぜこれを歌と言えるのでしょうか?それは、一定の複雑な構造を持っているからです。

フレーズがある。人間の音楽では、メロディA、メロディB、そしてメインパート、のようになっていますよね。彼らも、メロディA、メロディB、そしてメインパート、のような、こういう構造を歌うことができる。 そして驚くべきことに、もし我々が… だから、この理論は

毎年ハワイのマウイ島に行き私自身で録音している。

今日は今、2月ですね。

2月頃、冬が終わる頃に、北大西洋から南極に繁殖期のために彼らはやってきます。冬にハワイに行けば、彼らの曲を録音することができます。

ですから、私は毎年冬にハワイに行き、水中マイクを使って録音しています。私がやっていることは、J.S.バッハの曲やDNAのように、彼らの歌を象徴化しようとしていることです。もしこの曲を記号で表現できれば、音楽のように分析することができますよね。そして、私たちは理解しました、実際、JSバッハの曲やDNAのように、彼らの曲にも自己相似構造があり、全体と部分の間には同じパターンがあることを。

This is very surprising.

So, why the bird and human and what else can sing? Because they are intelligent.

So, the brain are growing. So, something is related between the intelligence and heart. So, what is intelligence? My hypothesis is… So, this question is related about what future of AI.

And my hypothesis is… It’s the future of human or intelligent, really intelligent creatures. Here, not long time ago, people think space is round, right? And now, we know the earth is turn round. So, to find this theory, we need deductive thinking.

これは非常に驚くべきことです。

では、なぜ鳥や人間、そしてその他にも歌えるものがいるのでしょうか?

それは彼らが知能を持っているからです。

脳が成長しているからです。 つまり、知能と心には何らかの関係があるということです。 では、知能とは何でしょうか?

私の仮説は… この問いは、AIの未来について関連しています。

そして私の仮説は… 人間、あるいは知能を持つ、本当に知能のある生き物の未来についてです。 少し前までは、人々は宇宙は丸いと考えていましたよね?そして今では、地球が回っていることが分かっています。この理論を見つけるには「演繹的な」思考が必要です。

Instead of induction, induction is thinking. Because deduction, this kind of hypothesis is to think about, to come up with hypothesis from nothing. Or we cannot, we cannot this kind of hypothesis inductively.

So, to progress the human civilization, we need deductive thinking. Because we need more sophisticated hypothesis and more sophisticated theories. So, this is the future of human basis.

The AI, if the AI can make a hypothesis, probably we have no meaning of existence. And we might extinct. So, this is very important.

And this is my work. It’s about the design of the computing. Because to make a hypothesis, we have to think about a lot of combinations, a lot of patterns of hypothesis.

And we have to try and learn or we have to choose it. So, if we compute, if we think about this, if we make this kind of computing, we need much more powerful computers. And the goodness of quantum computer is the high power features.

So, I designed the special quantum computer for this. But this theory is based on quantum logic. What is quantum logic? It’s very, it’s very still questioning.

帰納ではなく、演繹。なぜなら、この種の理論は、ゼロから仮説を考える必要があります。この種の仮説を帰納的に導くことはできません。

ですから、人類の文明を発展させるためには、演繹的思考が必要です。なぜなら、より洗練された仮説やより洗練された理論が必要だからです。これが人類の未来の基盤です。

AIが仮説を立てられるようになれば、おそらく私たちは存在意義を失うでしょう。そして、私たちは絶滅するかもしれません。ですから、これは非常に重要なことです。

そして、これは私の仕事です。コンピューティングの設計についてです。説を立てるためには、多くの組み合わせや仮説のパターンについて考えなければなりません。

そして、試行錯誤し、学習し、選択しなければなりません。ですから、もし私たちがコンピューティングを考え、この種のコンピューティングを作ろうとするなら、より強力なコンピューターが必要になります。量子コンピューターの優れた点は、その高度な並列性です。

そこで私は、この目的のために特別な量子コンピュータを設計しました。しかし、この理論は「量子論理」に基づいています。量子論理とは何でしょうか?それは、今だに、非常に不思議な、

実際に、未解決の問題なのです。

It’s actually still questioning. This is really about the smallest unit of this world. And how smallest unit of this world is computing.

This is one of the most important and difficult question of us. And to know that, we have to see quantum level. We have to observe quantum level.

So, this experiment is, we use, we have two small, two laser lights and we hit it. We hit the lasers. If we hit the lasers, we can see the form of wave.

So, now we can see that on the black screen. And this is a wave shape, right? So, from a long time ago, like around 20th century, we question about the particles, the minimum unit of this world is particles or waves. And now we can see the waves.

But we can also see the particles, right? So, I’m interested in how this world is computing. And to know that, we have to know how the quantum particles or quantum unit, like this, in this case, it’s electrocity, electrophoton. We call it the photon.

That’s the unit of light. If we hit two particles of light, we can see waves and particles. But if it’s, if the particle is waves, we cannot see.

これは、この世界の最小単位についてです。この世界の最小単位がどのようにコンピューティングを行うのか。

これは私たちにとって最も重要で難しい問題のひとつです。それを知るためには、

量子レベルを観察しなければなりません。

この実験では、2つの小さなレーザー光線を使用し、それを当てます。レーザーを当てると、波の形が見えます。

今、黒いスクリーン上でそれを見ることができます。そして、これは波の形ですね。ずっと昔から、20世紀頃から、この世界の最小単位は粒子なのか波なのかという疑問がありました。そして今、波を見ることができます。

でも粒子も見えますよね。

私はこの世界の計算方法に興味があります。それを知るためには、量子粒子や量子単位、この場合は電気、エレクトロフォトンがどうなっているかを知らなければなりません。私たちはそれを光子と呼んでいます。

光の単位です。光の粒子を2つぶつけると、波が見えます。しかし、光が粒子の場合、波は本来見えません。

Sorry, I forget the details of the experiment because it’s a very long time ago. But the conclusion is, if the result of the experiment is only able to be seen, if, yeah, I remember. So, I’m sorry.

Okay, so, just one basic, just one basic, and we split it. We split it to two groups, and we hit again. So, once we, light is split, it’s mirrored, and we hit two rounds again.

So, this kind of results can be seen only if the light is, if light exists A and the position A and B at the same time. This is really contradictory, because we believe that a same existence must exist just in one position, right? So, we believe that the same existence, for example, the same human cannot exist in two places. It’s not possible.

But the result of this shows that the particle separated, originated from only one, only one point, yeah. One, the same, the same element, the same photon, has to exist in position A and B at the same time. This is really contradictory.

すみません、かなり昔のことなので、実験の詳細を忘れてしまいました。でも結論は、実験の結果が見える場合…いや、すみません、今思い出しました。

わかりました。ええと、光源がひとつだけです。そう、その単一の光を(ガラスのスプリッターで)二つの経路に分けます。一度スプリットして、(反射させて)もう一度合流します。単一の光(の経路を二つに)分離して、反射させ、もう一度合流します。

ここに表示されているような結果は、(二つに分けた経路上の)Aの位置とBの位置に同じ(存在である)光子が同時に存在する場合にのみ観測できます。

これは本当に矛盾しています。なぜなら、同じ存在はただ一つの位置にのみ存在しなければならないと私たちは信じているからです。

ですから、同じ存在、例えば同じ人間が二つの場所に同時に存在することはありえないと私たちは信じています。ありえないですよね。

しかし、この結果は、たった一つの点から発射された粒子(の経路)が分かれて、その後、同時にAとBの位置に存在したことを示しています。これは本当に矛盾しています。

So, okay. And if we solve this problem, we might know about the limit of AI, or what is intelligence, or what the human, what is the meaning of human basis. So, and as I think before, this kind of problem can be solved only cross-interdisciplinary, cross-collaborations.

By mixing many of our knowledges, we can solve this kind of problem. And so, what we are doing now is to make a platform, competing platform for scientists or researchers. And this is our latest system, LLM agent system.

さて、こうした問題を解決できれば、AIの限界や知能とは何か、人間とは何か、人間らしさとは何か、といったことが分かるかもしれません。

昔から私自身思うことですが、このような問題は、学際的かつ共同的な取り組みによってのみ解決できるのです。

多くの知識を混ぜ合わせることで、このような問題を解決することができます。

そして、私たちが今行っているのは、科学者や研究者のためのプラットフォーム、計算プラットフォームを作ることです。

これが私たちの最新のシステム、LLMエージェントシステムです。

Not just chat, but it can program complex workflows involving trial and error. And there are three things this platform can do. First, automating construction of middle-sized applications.

Imagine how many specialists without professional competing skills in this world. And what happens if all of their ideas can turn into reality without in-depth computing knowledge. How much faster our human progress accelerates.

And this system allows people who have no skills to build middle-sized applications. To make it just by uploading a data to a dedicated drive and interactively build middle-sized applications. Numerous applications.

And we are now integrating this AI, extracted components or know-how, is integrated into our carefully designed LLM agent system.

単なるチャットではなく、試行錯誤を伴う複雑なワークフローをプログラムすることができます。このプラットフォームには3つの機能があります。

まず、中規模アプリケーションの構築を自動化することです。この世の中に、ソフトウェアスキルを持たない専門家がどれほどいるか想像してみてください。そして、もし彼らのアイデアがすべて、コンピューティングの深い知識がなくても実現可能だとしたらどうなるでしょうか。私たちの人間としての進歩はどれほど加速するでしょうか。

このシステムは、スキルを持たない人でも中規模アプリケーションを構築することを可能にします。専用ドライブにデータをアップロードするだけで、インタラクティブに中規模アプリケーションを構築することができるのです。

そして、私たちは現在、数々のアプリケーションを実装してきたノウハウや、抽出されたコンポーネントを、私たちのAI、慎重に設計されたLLMエージェントシステムに統合しています。

The second is special hardware high-performance computing. Cloud systems and processes big data in real-time. I talked about high-performance computing yesterday.

High-performance computing is computing using special hardware like GPU. Now we all know about GPU. But we are using another kind of hardware.

And we are trying to make a sophisticated computing platform which can handle telescope image analysis. You know, the telescope image, if it’s really high accurate, the image is really huge. And two, it’s not just image, it’s movie.

So the data is so, so big. And if we analyze it in real-time, our CPU-based computing is not enough. So that’s why we are making another type of system using a special hardware, which is mostly called programmable accelerator.

It’s a team, including Tohoku University, who is one of the most high-tech universities in Japan.

2つ目は、ハイパフォーマンスコンピューティング(HPC)用の特別なハードウェアです。私たちのクラウドシステムは、ビッグデータをリアルタイムで処理します。昨日は、ハイパフォーマンスコンピューティングについてお話ししました。

ハイパフォーマンスコンピューティング(HPC)とは、GPUのような特殊なハードウェアを使用したコンピューティングです。GPUについては皆さんご存知でしょう。しかし、私たちは別の種類のハードウェアを特に使用します。

例えば、望遠鏡の画像分析を処理できる高度なコンピューティングプラットフォームの構築を目指しています。ご存知のように、望遠鏡の画像は、非常に精度が高い場合、画像は非常に巨大になります。さらに、(静止した)画像でなく動画です。

データは膨大です。リアルタイムで分析しようとすると、CPUベースのコンピューティングでは十分ではありません。そこで、特殊なハードウェアを使用した別のタイプのシステムを構築しています。これは主にプログラマブルアクセラレータと呼ばれています。

これは、日本でも最もハイテクな大学のひとつである東北大学を含むチームです。

And third, Data Hub Marketplace gives incentives to share research data. So now our research data, numerous research data, has gone unused.

Simply because there is no incentive to share it. So the absolute data hub gives possibilities to researchers. If more data is shared, more collaborations are accelerated.

そして3つ目は、データハブ・マーケットプレイスによって研究データの共有を促すインセンティブを提供することです。現在、数多くの研究データが活用されずに眠っています。

それは、共有するインセンティブがないからです。データハブは研究者に収益の可能性を与えます。より多くのデータが共有されれば、より多くの共同研究が加速します。

So now our 800,000 line system is running in our dedicated high-performance computer. And it’s getting more powerful with teams, top-tier teams, including our in-line researches for Tohoku University. There are a variety of applications of this program, but there is one special question.

現在、80万行のシステムが、専用高性能コンピューターで稼働しています。 トップティアのプロフェッショナルを含むチームにより、さらに強力になっています。

There is one special question. And the question is, how can we keep this environment up to us, even if the population is getting growing and we have no natural resources? So this kind of program has a global emergency and universal impact. And one of our answers is accelerating cross-disciplinary collaboration in highly segmented and isolated research fields.

This is the key to solve this kind of problem.

このシステムにはさまざまな応用がありますが、特別な問いがひとつあります。

その問いとは、「増え続ける世界人口に公平に資源を確保しながら、持続可能なエネルギーへの移行を迅速に進め、気候変動を緩和するにはどうすればよいか?」というものです。

世界的に喫緊の課題であり、普遍的な影響力を持つ問いです。

そして、私たちの答えのひとつは、「高度に細分化され孤立した研究分野における学際的なコラボレーションの加速」です。この種の問題を解決する鍵だと考えています。

So finally, science says the world is complex. And turning back to the first topic, we talked about the Zen.

And the concept of Zen says this world is empty.

This world is complex, but this world is empty. And if we say the complex is meaningful and the empty is meaningless,

the truth is we say love is blind.

And blind looks empty but meaningful.

So attention is all you need.

And all you need is love.

Thank you for your attention.

最後に、

科学は「世界は複雑だ」と言います。

最初の話題を振り返ると、私たちは禅について話しました。

禅の概念は言います。「世界は空である」と。

この世界は複雑で、同時に空である。

もし、複雑であることを有意味とし、空なものを無意味と呼ぶならば、

真実は、

「愛は盲目である (Love is brind)」。

「盲目」とは、一見して空っぽのようであり、しかし、同時に有意味である。

だから、「集中だけが必要」(Attention is All you need)であり、

「必要なのは愛だけ」である(All you need is love)。

ご清聴ありがとうございました。

Thank you for the very informative session. I would like to ask, you mentioned about AI and the different aspects of it, discovering different aspects of the world, like interpreting the sounds created by intelligent creatures such as dolphins or whales or other creatures or beings.

非常に有益なセッションでした。お伺いしたいのですが、AIとその異なるさまざまな側面、例えばクジラ、その他の生き物や存在が発する音の解釈など、世界のさまざまな側面を発見することについてもお話されましたが、

So what do you think would be the base of AI when it comes to human emotions? Is it able to interpret or replicate or improve on its interpretation on how to improve, basically, or have a better understanding of AI connecting to emotions in general?

Not only with humans but also with other beings.

では、人間の感情についてAIのベースとなるものは何だとお考えですか?

解釈したり、複製したり、解釈を改善したり、基本的には、AIが感情全般とつながることで、より理解を深めることができるのでしょうか?人間だけでなく、他の生物ともつながるのでしょうか。

Because everything has, I believe, its own form of intelligence. So what about understanding from the lowest to the highest possible intelligence through AI? So how do you think would be the big breakthrough on this field? That’s a really interesting topic.

なぜなら、私は、あらゆるものに独自の知性があると考えています。AIを通じて、最低レベルから最高レベルの知性を理解することは可能でしょうか?この分野における大きな進歩は、どのようにして起こると思いますか?

That’s a really interesting topic.

Actually, a long time ago, I was researching about the emotion, extracting emotion from the human voice. Human signals represent our current human emotion. So the point is, the signal can be recorded in unlimited frequency, right? So if we get, like, 40,000 Hz voice data, we have this limited data, and we can analyze it, and we can extract some emotional patterns from these signals.

それは実に興味深いテーマですね。

実は、かなり以前に、私は感情について研究していました。人間の声から感情を抽出するということによって。人間の信号は、現在の人間の感情を表しています。重要なポイントは、信号は無限の周波数で記録されうる、ということです。もし、4万ヘルツの音声データのような限られたデータを得て、分析し、そうした信号から感情パターンを抽出することができる。

But if our world is really about quantum stuff, if our world can be recorded in unlimited frequency, if our world, the fundamental unit of our world, has some unlimited space, it means we can extract unlimited frequency data from something. So it has unlimited information. So if we analyze, if we can approach to the unlimited size of information, we can know everything.

しかし、もし私たちの世界が本当に量子的なものであり、私たちの世界が「無限の周波数」で記録でき、私たちの世界の基本単位が無限の空間を持っているとすれば、それはつまり、何かから、無限の周波数のデータを抽出できることを意味します。つまり、無限の情報がある、ということです。もし私たちが、無限のサイズの情報にアプローチすることができれば、すべてを知ることができるでしょう。

But, so it’s relying on the one big problem, this one has big or not. And the second is a technical problem. Technically, if we can know very small world, we can take a data about very small world.

しかし、それは1つの大きな問題に依存しており、この世界に「無限」が存在するか、にかかっています。

2つ目は技術的な問題です。技術的には、非常に小さな世界を知ることができれば、その世界に関するデータを取得することができます。

If we can take unlimited small data, we can know everything. And so now you know the AI has a size, right? So this size is decided by the size of matrix. So if we can get the unlimited size of matrix, and if this world has unlimited smallness, if we can have the unlimited size of matrix, we can compute everything.

無限に小さなデータを取得できれば、すべてを知ることができます。さて、AIにはサイズがあることはご存知ですね。このサイズとは、行列のサイズのことです。もし、この世界に無限の小ささが存在しているのであれば、そして、無限の大きさの行列が手に入れば、すべてを計算できることになります。

And we can compute every details of emotion, or every details of human, human, human, sorry, every, any information. So everything is, everything is decided by what is the fundamental unit of this world. But, like, it’s depend on how detail we define the emotion.

そして、感情や、人間..失礼、人間、に関わるあらゆる詳細な情報を計算できます。ですから、すべては、この世界の基本単位が何であるかに依存します。

一方、感情をどの程度詳細に定義するかによっても変わります。

For example, very huge novel like Dostoevsky, if you read Dostoevsky, we can feel some kind of emotion, and which is, which cannot be represented just by 140 text. It’s not possible to represent this kind of emotion. So this is depending on how we, how we define, how we see the details of an emotion.

例えば、ドストエフスキーのような非常に大きな小説を読んだ場合、140文字のテキストでは表現できない感情を私たちは感じることができます。このような感情を表現することは今のところは不可能です。これは、私たちが感情をどのように定義し、どのようにその詳細を見るかによって決まります。

So, and the novels tells, we might have unlimited kind of emotion, right? For example, if we write a size of novel, we can, we might be able to represent new type of emotion, right? So we might have unlimited variety of emotion. So this is depend on what, how, how, how much we cover the emotion type is. And only just simple emotion like surprising, or angry, or happy, it’s really, it’s not difficult for us.

So far, we can do it, we can do it. So, I believe that in the future, we will, we will use the theater like novel, like Dostoevsky. Dostoevsky will be an important theater for understanding human’s emotion.

And so, this is my, one of my hypothesis about the concept, which I call the combination of science and art.

小説では、無限の種類の感情を表現できるかもしれません。ですよね?例えば、小説のサイズで書けば、新しいタイプの感情を表現できるかもしれません。ですから、感情の種類は無限にあるかもしれません。問題は、感情の種類をどれだけ、どのようにカバーするかに依存します。驚き、怒り、喜びといった単純な感情だけなら、なんら難しいことではなく、今のところ、私たちはそれをすることができます。ですから、将来、私たちは、ドストエフスキーの小説のようなデータを使うことになると思います。つまり、ドストエフスキーが人間の感情を理解する上で重要なデータとなるでしょう。

これが、私が「科学と芸術の融合」と呼ぶコンセプトがもつ複数の仮説のうちのひとつです。

Arigatou gozaimasu. One more follow-up question.

Speaking of AI, what is the stat of AI in discovering the other possibilities? So for now, science is able to explain most of the practical concepts of life. What about the possibility of AI augmenting and making sci-fi or science fiction into a proven science? For example, quantum mechanics. Basically, it mentions that you can be connected to some distant place by this entanglement and all.

ありがとうございました。もう一つ、追加の質問です。

AIについてですが、AIが他の可能性を発見する状態とはどのようなものでしょうか? 今のところ、科学は生命の実用的な概念の多くを説明することができます。 AIがSFを実証済みの科学に拡張し、実現させる可能性についてはどうでしょうか? 例えば、量子力学です。 基本的には、量子もつれによって、遠く離れた場所と接続することができると言われています。

So what do you think would be the stand of AI and how can it discover the undiscovered areas of science? Because nowadays, we can label like science fiction as something that is a possibility but not yet proven. So how do you think AI can come into that working order to make that unproven science into a proven one? Like a science fiction into something that is explainable and understandable in the human comprehension. I mean, we started with emotion.

AIはどのような立場を取ると思いますか?また、AIはどのようにして科学の未発見分野を発見できるのでしょうか?現在では、SFのようなものは可能性はあるがまだ証明されていないものとして分類することができます。 では、AIはどのようにして、その未証明の科学を証明されたものにする作業に取り掛かることができると思いますか?SFを、人間の理解力で説明でき、理解できるものにするような。 つまり、私たちは感情から始めました。

Understand that emotion is a complex thing. Frequencies, vibrations. There are a lot of things that we are not yet able to discover.

Like what’s beyond space? What is dark matter? Science is an idea, but of course, it’s a vast universe. So how do you think AI will come into action and help discover or become conscious of those?

感情は複雑なものです。周波数、振動。まだ発見されていないものはたくさんあります。

宇宙の向こう側にあるものは何なのか? 暗黒物質とは何なのか? 科学はアイデアですが、もちろん広大な宇宙です。 では、AIがどのように作用し、それらの発見や意識化に役立つと思いますか?

So now, if we say what is AI, what is the modern AI? This is a machine to represent us, right? So if the computing ability is unlimited, it can represent everything of us, everything of our behaviors. It also includes our thoughts.

This question is also the line of the theory of this world. Unlimited. If infinity exists.

今、もしAIとは何か、現代のAIとは何かと言えば、これは私たちを模倣する機械です。 だから、コンピューティング能力が無限であれば、私たちのすべて、私たちの行動のすべてを表現できます。 思考も含まれます。

この問いは、この世界の理論の境界線でもあります。無限大。

Because if infinity exists, basically humans have a motivation to realize everything that we imagine. Like in science fiction. So what we can imagine, we realize it in the future. If it is possible. So the problem is, if it is possible. So, if it is possible, everything is possible.

Because the computing speed relies on how much smaller the unit is, right? If it’s a quantum computer, it uses more smaller units of elements of this world.

なぜなら、もし無限大が存在するなら、基本的に人間は想像するすべてを実現する動機があるからです。SFのように。つまり、想像できることはすべて、将来的に実現するということです。

問題は、それが可能かどうかです。可能であれば、すべてが可能になります。この世界が無限の単位で構成されているとすると、コンピューティングの速度は、ユニットをどれだけ小さくできるかにかかっているわけですよね。それが量子コンピューターであれば、この世界の要素の(電子的な計算機より)さらに小さな単位を使用するわけです。

But if we have more smaller elements, smaller elements of quantum something, we will be able to make much faster computing. And it might be able to simulate more complex stuff, like the behavior of the sea. We cannot compute at all right now.

ですが、さらに小さな要素、量子よりもさらに小さな要素があれば、さらにもっと高速なコンピューティングが可能になるでしょう。そして、海の挙動のような、より複雑なものをシミュレートできるかもしれません。今はまったく計算できません。

And the human emotion also. Everything is from human behavior. So, my answer is almost similar to the last question.

It is really dependent on how smaller this world can be separated.

人間の感情もそうです。すべては人間の行動から生まれます。ですから、私の答えは先の質問へのそれとほぼ同じです。

この世界をどれだけ小さく分離できるかどうかにかなり依るだろう、というものです。

Thank you so much.

ありがとうございました。

Do anyone else have some topic or discussion? Discussion topic or question? Okay, now it’s a good time. Thank you for listening.

他にディスカッションのトピックや質問はありますか?では、そろそろいい時間ですね、ご清聴いただきありがとうございました。

計算と時間

Mona Lisa(モナ・リザ)

Leonardo da Vinci’s Mona Lisa, ca. 1503, at the Louvre, Paris

.

ルーブルで実物を目にすると小さな、あのモナリザは、何ヶ月かけて作られたのかを最近知った。

5ヶ月?いや、50ヶ月、つまり4年である。

それだけの間、あの小さいキャンバスに無数の書き込みが繰り返された。

モナリザが真の傑作かどうか、もしそうならなぜそう言えるかは別の議論として、

この事実は、何を描いたかなんてさして重要な問題でない、という主張の正当性を強化する。

ダヴィンチが同じ時間をかけて犬を描いたとしても、それはモナリザに相応する傑作になったのではないだろうか。

効率主義者たちは、最初の進む角度が少し間違うと後で大きな違いになる、だから最初に正しいアイデアであることが重要だ、と言う。

こうした考えが当て嵌まるのはより短期的な、些細な物事であって、歴史の中ではノイズにすぎないような些細な変化を超えると、最初に打ち込む角度と結果との関係はほとんど無関係になる。

短いベクトルなら少しの方向の違いがゴールへの到達距離を激しく変える。

それは三回打ってホールに近づくゴルフのようなものだ。

三千回打つ必要があることなら、少しの方向の違いなんて殆ど重要ではない。

重要なのはキャンパスに描き込み続ける精神力を保つ何かで、何を書くか、最初のアイデアは描き込んでいる間に何らかの意味のあることに軌道修正されて、

どこか誰も到達しなかった場所に辿り着いている。

鍵は時間である。アイデアはその意味で取るに足らない。三千回クラブを振っていたら、初期のアイデアなんてどこかに吹き飛んでいる。どこかの山に登り始めている。

これはテクノロジースタートアップの世界でも一般に言われ、また当て嵌まる。

そして、物理学と計算科学の違いは、後者には離散的な時間ステップという概念が顕著にある。

.

創発性, 論理, 自己複製子の観点から<コンピューターが知能を持つか>という問題について – 原題: ChatGPTに知能はあるか

 
私たち人間の脳,DNA,自然言語,そしてチューリングマシンをエミュレートする一連のコンピューターはどれも<計算普遍性>を持つシステムである.
 
計算が普遍性をもつとは,大雑把には「考えられることは何でも記述できる」ということである*1.
言語を例にとれば,私たちの言葉は音素(phoneme)の無限通りの組み合わせから生成でき,言い換えれば語や句を生成する音素の連結は無限通りあることになる.例えばこの「音素(phoneme)」という言葉は,音(phone: 声音)と素(-eme : 基本単位)の結合から生成されている.ここで,音(Phone)と素(-eme)を組み合わせた新たな概念である音素(Phoneme)は単にもとの2つの構成要素がもっていた意味を足し合わせたというだけでなく,“音声学的な”発話音響の基本単位 (Basic unit of phonetics speech)」という新たな抽象レベルの意味が付与され,この新たな概念はもとの<還元的>な構成要素のみから説明することができない
 
“~を作る”,という意味のen-をさらに連結すればenphonemeといった語を生成でき,同様なやり方で無数の任意の概念を生成できる.その連結にさらに一定の結合規則を敷けば論理的な関係を表現でき,依然として語の連結で表現できるため,語と語同士の関係を表す意味的表現は無限に生じうる.
コンピュータープログラムも同様に,有限の語を並べることで無限の組み合わせを表現し,ある並べ方は何らかの規則の上ではひとつの「意味」が対応するから,無限の「意味」を生成できることになる(殆どの組み合わせは機能をもたないという意味で「無意味」だが)一般に,こうした計算普遍性をもつコンピューター*2 の言語は一定の抽象レベルをもっており(それによって人間が操作できる),プロセッサの中ではより基本的な語(命令セットと呼ばれる)の連結に「還元」される.
重要な点は,普遍性を持つことができる計算システムを構成するための最小の基本的な語と規則の種類は各々たかだか片手で数えられるほどしかなく,例えばn個の記号によって無限の整数を表現できる「n進数」という数の表現も,先の「音素」の例と同様,結合による「新たな抽象レベルの概念」の生成である(ただし数はもとの構成要素から説明できる).
この少ない「元」の「合成」から取りうる表現が全て可能になるという事実は,私たち人間の脳の思考が高々片手で数えられる<還元的>要素の組み合わせによって,どこまでも表現されうることを意味している.
(厳密には集合内の任意の自然数の合成に関する数理論理学的形式化により理論化される)
三つの塩基からなる語単位であるコドンにグループ化されたDNA複製子の塩基対も同様に,高々3ビット(最大8通り)の語の有限の並びの組み合わせからなる計算普遍性をもつシステムである(ただしDNA鎖の長さは高々10億塩基対しかなく,情報量に換算すれば高々800MB程で,「考えられる全ての概念」を表現するには短い.この「全ての概念」のより詳しい意味は後述する.).
もう少し身近なを挙げれば,水分子は,水素結合が「整列した方向で結合」するときその全体はハンマーで叩けるほど「硬く」,「ばらばらの方向で結合」しているとき,容器がなければ「こぼれる」ような振る舞いをする.この氷と水の相転移による変化で発生した新たな性質である「硬い」や「こぼれる」といった性質は隣り合った水分子の微視的な観点,つまり構成要素からのみ説明できない新たな性質である.
こうした<還元的要素>が,ある原始的な操作(この場合,結合や並置.数学的には合成)によって関係づけられると,もとの要素のみからは説明できない新たな性質が生まれることを<創発性>という.
創発性についてはAIとの関連で後ほど詳しく述べる.
なお,ここで言う無限とは修辞ではなく数学的な意味での無限である.
 
本稿では,こうした観点から,
 
「<ChatGPT型のAI>,または<コンピューター>は知能を持つと言えるか?またはこれから持つだろうか?」
 
という問いに答える.
 
「創発性」と「論理」による2つの見方を述べ,
コンピューターは理論上無限の進化が可能になることを説明し,
最後に,遺伝子の自己複製メカニズムとの比較から将来的に言語モデル型のAIは驚くべき可能性をもつことを示す.
 
パラメーターの数が1750億規模に増大した大規模言語モデルの高次元空間はブラックボックスとされ,その振る舞いを説明する確たる理論は存在しない
本稿は計算機<科学>の基礎的な素養がある,ある程度専門知識のある読者も対象にしながら,
それらが全くない一般の読者でも大まかにイメージとして理解できるように述べる.
 
(ただしブログという媒体の性質上細部まで記述できず,より深く理解したい人に向けた体系的な本を書くことも検討したい.ご興味のある出版社の方はご連絡頂きたい)
 
尚,私のAIとの関わりは10年以上となり,2012年に音声感情認識アルゴリズムをコア技術とするThinkX, Incを米国カリフォルニア州滞在中に創業,2015年に国内で同社を前身とする音声言語処理による次世代インタラクティブシステムの研究開発企業を創業(現ThinkX株式会社),現研究主幹兼CEO.
学術上では,東京大学大学院在学中に高次元空間上の言語概念の意味の量化に関する計算学習理論モデルの論文,演繹的推論を表現する量子計算機の数理モデルと計算言語の論文を執筆(いずれも単著),同大学院情報学環客員研究員として演示解析の研究に従事した.
 
1. 創発性
 
計算普遍性をもつシステムの強力な点は,厳密に説明できることならどんな複雑な事象であれ単純な要素の組み合わせからシミュレートできることである.
冒頭でも説明した通り,人間が成長段階でごく自然に理解し,殆ど無意識に扱っている抽象概念はすべて,還元的要素の合成から生じた創発性によって生じた,より高次の創発レベルにあるシステムの性質ということができる.
 
したがって理論上は脳のメカニズムが分かっているならば,たとえ”構成方法は異なっていても“,脳を計算普遍性をもつコンピューター上の「単純な」演算の結合でシミュレートすることができる.
一方で脳の動作原理は解明されておらず.特に「意識の生の感覚」としてのクオリアは物理的実在に還元できないとする議論がある.
 
ChatGPTはまず人間がこれまで残してきた一定の品質の文字情報として得られるできる限りのデータを学習させた上で,
さらに,人間の「あるべき振る舞い」をシミュレートするように微調整(ファインチューニング)して作られている*3.
 
あるパラメーターの規模を超えると,その「創造主」たる人間にも説明できない高度な振る舞いが生じ,まるで「何かを考えている」ような性質が現れ始めた.現象論的立場ではこれを「創発性」の結果とするのが最善の説明と考えられる.
冒頭で述べたように,系(システム)は一定の「元(還元的要素)」と「演算(合成律)」に関する条件を満たすことで,「規模のスケール」によってもとの微視的な挙動のみからは説明できない異なる性質が生じるという一般的事実がある.
大きさ(スケール)こそが本質的なのである.
 
重要な点は,計算普遍性をもつシステムが脳をシミュレートするうえでは,シミュレートする対象である脳と同じ動作原理に基づく必要がない
コンピューターも我々人間も二桁の掛け算を実行することができるがそのやり方(動作原理)は異なっている.
同様に,二桁の掛け算より遥かに複雑な思考,例えば「死後の世界を想像」したり「生命の存在意義に関する理論を導く」と言った思考,をコンピューターが行えるようになったとしてもおそらくそれは人間の脳とは違った原理で行うことになる.
それでもコンピューターは,人間にとって可能なあらゆる思考を達成できないとする理由がない
コンピューターが計算普遍性をもつ限り,そして数学的な意味での無限が実在として仮定される限り,あらゆる結果を生成する潜在能力を理論上は持っているから,人間の脳が物理的に生成できることを生成できないとする理由がないのだ.
「私」という自我やクオリアのような脳の働き(心が脳にあるかどうかは別として)でさえ原理的にはシミュレートできる.
それらがある抽象レベルでの創発的結果である限り,「私」や「無政府主義」や「甘い香りのロマンス」でさえも,その<値>は生成される
高度な抽象度をもった高い創発レベルの振る舞いを,より低い創発レベルの振る舞いから「説明」はできないが,「合成(ある律に従い元を結合すること)」は理論上可能である.
 
そのために原始的な合成律*4以上に複雑な内部機構の追加は通常必要がない.たかだか三つの塩基の結合によってアミノ酸をコード化するコドンの言語システムは生命が誕生して以来原理的に変わっていないにも関わらず,そのプログラム機構から生じた生命は今や「生命の存在意義に関する理論を導く」ことが可能となっている.
計算普遍性を満たす最小の語(元)と演算(合成律)を組み合わせることのできるシステムと,そのスケール(巨大化),そしてそれを適切に導く肉体と外部環境だけが必要である.
 
そして示唆されるのは,実は我々の脳も同様に,単純な機構の巨大な「塊」に過ぎないのではないかという洞察である.
 
2. 論理
 
英語は相対的に,<論理的な明晰さ>をもった言語である.
数学のテキストを英語で読んだり,イギリス人ネイティブスピーカーと論文の校正作業を繰り返し行う過程を経て,
私はこの事実をおそらく本当の意味で体得的に理解するようになった.
例えば,
 
the bird in a herd
 
と言ったとき,「ある適当に選んだ群れの中の”どの鳥にも該当する”」ことを指し,
 
a bird in a herd
 
なら「ある適当に選んだ群れの中の鳥の”ある鳥に該当する”」ことを指す*5.
日本語の文法システムはこうした数学的な厳密さを表現する抽象形式を持たない.
単に「群れの中の鳥」と表現することで両者の状況を多義的に表現する*6.
多民族国家の言語は単一民族国家の言語と異なり,「私」と「あなた」の「常識」が一致している前提はないから必然的に明晰さを必要とする.
 
こうした英語の論理性は,創発性の基本的土台としての「元」と「合成」から成るシステムが一貫した規則によって「値」を生成するために不可欠と言える*7.
 
計算機の専門家の間ではしばしば,巨大な行列で表現されるニューラルネットワークが記号論理の表現力を欠いていると主張され,行列という一見した数値の羅列には,人間が「シンボル」として操作するような数学的表現力は無いとする議論がある.
この立場はいくつかの点で誤っている.第一に,人間の生み出すシンボルはそれがどんな抽象的に洗練された概念であれ,創発性に起因する生成結果と言える.第二に,そもそも巨大な行列は入出力を写像する関数として設計されているのだから単に「関数解析論として記述できない」という,ある「特定の」方法論が適用できないとする事実を主張しているに過ぎない.
 
あらゆる創発レベルにある概念が合成できる限り,それが例え公理的集合論や圏論のような抽象性の高い概念を必要とする理論であっても,可能な計算は全て理論上はエミュレートでき,無限の整数の集合内に割り当てられた「値」を指し示すことができる.
ただし,前述の通り,語(元)同士の合成規則(演算または律)の一貫性が,物理空間において分子の結合がその組成や構造によって一貫性をもつように,保たれ,学習できたときに限る.
規模の拡大から創発性を出現する必要条件として,英語がもつ論理性が合成規則の明晰さを担保し,
それによって巨大な行列の内部で一貫した結合規則をもつ論理ネットワークを形成し,この<因果律>が,原子の大きさや電荷,向き,空間的配置,によって共有結合の規則が決定される物理世界の因果律と同様に機能し,また創発性を生じさせる系の土壌になっていることが示唆される.
 
3. 自己複製子
 
ゲーデルは自己言及のパラドックスによって任意の数学的システムは自己の正しさを証明できないとした.
不完全性定理によれば,自分自身の体系を用いて自分自身の体系それ自体に矛盾がないことを示すことができない.
 
仮に自分自身を果てしなく修正し進化させることのできるシステムが存在するとしたら,
そのシステムはどのような状況にも適用し,生存の道を模索し,果てしなく生き延びる可能性をもつだろう.
計算普遍性をもつ自己複製子のメカニズムは,まさにこの能力を備えている.
 
DNAは化学物質や放射線などの環境要因により個々のヌクレオチドが変化し損傷すると,特定の酵素が「エラー」を認識し,正しいものに交換されることで自己を修復する.
紫外線等に起因するより広範な損傷に対しては,タンパク質のグループが「エラー」を認識すると,DNA鎖の損傷部位が切り出され交換される.
 
これらの自己修復機能とは別に,死と勾配による自然変異はDNA鎖に書き込まれたプログラムを間接的に書き換えるメカニズムとみなせる.
遺伝暗号の改変の正当性は,もとはプログラムという情報に過ぎなかったDNA鎖が,転写されたRNAを酵素の合成のための触媒として機能させることで化学物質が合成された実体としての肉体を用いテストされる.肉体の生存と繁殖可能性をプログラムの正当性の代理変数とみなすことで,正当なプログラムが次世代に複製され,果てしない生存を試みるという,精巧なメカニズムである.
 
この果てしない仮説と検証のメカニズム(これは科学啓蒙運動以降の発展プロセスそのものだ)の賜物として脳の創発レベルを進化させた人間はさらに直接的に,遺伝子工学の様々な方法を用い,自ら「プログラム」を書き換えることができるようになった.
 
大規模言語モデルがプログラムを生成できるという事実は,コンピューターあるいはAIが自らを「開発」したプログラムを改変することで,自己の新たなバージョンを「開発」し,自律的に進化する可能性を示唆している.これは原理的には可能である.
 
考えられることは何でも,それが道徳哲学に反しない限り検証される.コンピューターも自己複製子と同様に,物理的空間で自身のプログラムの正当性をテストするための「肉体」を持つ段階が,文字情報を学習し尽くした後に間もなく訪れるだろう.
異なる微調整(ファインチューニング)で学習され異なる振る舞いをするコンピューター同士は,人間が咽頭を発達させ言語を獲得し,農耕と家畜動物による資源の蓄積を開始し,民主的な議論を開始させたのと同様に,民主的な議論を始める
最適解を与える人間の道徳哲学を誤れば,資源とそれを司る役割との関係に歴史的な転換が訪れることになる.
核兵器が破滅の道具とならないための努力をしてきたのと同様に,人間は厳格なプロトコルと安全機能を整備していくことになるだろう.
 
4. 時間
 
「創発性」と「論理」の観点からコンピューターの潜在的な可能性を議論してきた.
一般相対性理論によれば宇宙は膨張しているが太陽系はその限りでなく,したがって地球内部の構成要素は一定のトレードオフを保ったまま流動する流れを作っている.
ChatGPT型の言語モデルの進化は,メモリ空間の中に自明でない普遍計算能力を備えた因果律をもつ系が生成され,巨大化したことにより,自然界が時間をかけて作り出す創発性をより短時間で人工的に生み出した結果とも言える.
この一般化が示唆するのは,有限な構成要素の空間的な分布の変化によって,果てしない進化を生み出せるという論理的帰結である.
故に,世界はこれからも果てしなく進化する.その中で本質的に意味のあるものは<時間>である.
進化とは創発性を作りだす組み合わせのことであり,時間が不可逆的であることを仮定すれば,時間をかけて生成された「値」*8 が必然的に<価値>をもつ.<価値>とは<目的>とも言い換えられる.
この多くの時間とコストを費やさなければ生じない組み合わせを,長い進化の歴史の証拠としての<美>と呼ぶ*9
AIの進化とともに科学と哲学は新しい時代を迎え,この事実もいずれ一般的な創発段階の知として普遍化する.
 
 
 
 

*1 専門的な読者のために,任意の自然数を合成できる代数的システムのこと.
*2 チューリングマシンをエミュレートできるコンピューターのクラスのこと.
*3 下記の論文などを参照のこと.
Ouyang, Long, et al. “Training language models to follow instructions with human feedback.” arXiv preprint arXiv:2203.02155 (2022).
Brown, Tom, et al. “Language models are few-shot learners.” Advances in neural information processing systems 33 (2020): 1877-1901.
Neelakantan, Arvind, et al. “Text and code embeddings by contrastive pre-training.” arXiv preprint arXiv:2201.10005 (2022).
Stiennon, Nisan, et al. “Learning to summarize with human feedback.” Advances in Neural Information Processing Systems 33 (2020): 3008-3021.
Chen, Mark, et al. “Evaluating large language models trained on code.” arXiv preprint arXiv:2107.03374 (2021).
*4 群の規則に相当する.但しどのような律が原始的な因果律かどうかは明らかでない.それを明らかにするには量子力学的「実在」に関する問いが解決される必要があると私は考えている.
*5 後者は文法規則上一般的だが前者はそうでないことに注意.
*6 勿論,より還元的な要素を用いて説明することはできる.そのような煩わしさを逃れるために,通常人間はより抽象レベルの高い創発的概念を作り出す.
*7 本稿は情報空間上のシステムについて議論している.発展的には,物理空間に対し同様な議論が可能である.例えば量子論のニールス・ボーア的な解釈では原始的要素を合成する「規則」は非決定的とされる.私はこれに同意しない.
*8 数理論理学的な意味において,ある集合から新たに合成された整数のこと.
*9 この詳細は私の論文「Computational Language β based on Orthomodular Lattices with the Non-distributivity of Quantum Logic」(2023)の前半で論じている.

半導体産業とマイクロプロセッサの未来

 

 今年も米国ハワイ州マウイ島に来ている.昨年2月の「なぜ円は安くなったか」の投稿から8ヶ月後に為替相場は歴史的な円安を記録した.2月は地球上で2番目に知能の高い生き物の繁殖シーズンで,ラハイナにはMartin Lawrenceがあってもワイキキには同水準のギャラリーは存在しないのは,単に”知っているかどうか”を超えた真の(知的)情報格差の顕著な分断を表している.この理解の深さを伴う「情報格差」を「教養格差」と呼ぶことにすると,世界はすでに指数的な差をつけている.マルサス的な考察をすれば,英文による「知識」の増加量は日本語のそれに対し「幾何級数的」に増大してきたからだ.幸い,テクノロジーは一昔前の世代とは比べ物にならないほど,グローバルな知へのアクセス可能性と効率的な運用ツールを提供する.だから,未来を担う世代は,それらを駆使し,古い方法論を捨て去り,コーカソイドと互角に議論できる水準の英語運用能力クリエイティブクラスの能力を早期に身につけ,日本を出ることだ.

 私たちの奇妙な形をした島国では11月に経済産業省によって大企業幹部を責任者とする半導体の合併会社が設立された.このプロジェクトは成功するだろうか.政策決定者らは,ポーズとしては「スタートアップ」を掲げつつ(10年前に西海岸で「スタートアップ」を始めた僕からすれば今からルーズソックスという感じだ.当時この言葉は日本で通じなかった.あとAIも通じなかった),依然として既成大企業という実質的な国家事業体の寄り合いに託生する構図を続けている点で「グローバル化」を掲げながら実態は留学生数を増やすといった分かりやすい目標だけが設定される形式主義に即座に陥るのは「教養格差」に依る(かなり柔らかく表現している).

 今回の記事では「コンピューターの未来」,とりわけマイクロプロセッサの未来に向けた戦略 – どのようなマイクロプロセッサとその周辺産業を作るべきか – についてやや専門的なレベルで考察する.プロセッサ性能の基本と歴史を概観しながら,5~10年後のコンピューティングに求められる需要予測とアーキテクチャの設計,そして日本が勝つための戦略を論じる.主に省庁の官僚や政策決定者,半導体産業に関わる経営幹部等の意思決定者に向けたものだが,コンピューターを勉強中の人々への励ましのメッセージでもある.尚,「コンピューター」とは古典コンピューターのことだが,最近論文も著した量子コンピューターについての考察は別の機会に書くことにする.数学的には古典計算機は量子計算機の特殊ケースだ.

そして,以下の内容を読んでも理解できなかった半導体産業に関わる意思決定者や政策決定者がいるとしたら,僕に連絡して下さい.まず,ムーアの法則を概観するところから始めよう.

・寸法 1/k (面積 (1/k)^2 ~= 0.5 倍)
・遅延 1/k (周波数 k ~= 1.4)倍
・電源電圧 1/k

となり,したがって,(1) トランジスタの寸法を30%(0.7倍)縮小すると面積は50%縮小し,トランジスタ密度は2倍になる.(2) それに伴い性能は約40%向上(遅延0.7倍,周波数1.4 倍)し,(3) 電源電圧を 30%低減し,エネルギーを65%,電力を50%削減する.まとめると,集積度は2倍,40%高速化し,消費電力は変わらない.

 そしてムーアの法則の経験的観測では,(1) トランジスタ数は約24ヶ月で2倍, (2) 20年間で1000倍の性能向上,を実現し,例えば1971年のIntel 4004では1 coreキャッシュなしトランジスタ数23Kだったのが,7年後のIntel 8008では1 coreキャッシュなしトランジスタ数29K,そこから21年後にはIntel Nehalem-EXが8コア24MBキャッシュトランジスタ数2.3Bへと進化した.2015年のOracle SPARC M7では32コア10Bトランジスタとなり,コア数が増大してきた.これには後述するように,ムーアの法則によってトランジスタの集積度は向上する一方で,シングルスレッド性能はすでに横ばいであり,トランジスタの速度とエネルギーはほとんど改善されないことから,エネルギー最適化された大規模な並列処理が性能改善の主要なポテンシャルとなっているためである.

 したがって,コンピューターの性能向上を考える上では,シングルスレッド性能はほとんど改善されず,エネルギーが性能を左右するという前提に立つ必要がある.そのためにはシングルスレッド性能の高い大型コアと低周波・低電圧だが性能の低い小型コアを多数組み合わせるアプローチや,暗号エンジンやメディアコーデックに特化したアクセラレータや動的に変更可能なFPGA等のカスタマイズハードウェアの利用などが有効である.例えばエネルギー効率が特に考慮されるモバイル端末のSoCでは数十またはそれ以上のアクセラレータを搭載することでエネルギー効率と性能のバランスをとることができる.また,メモリ階層を移動したりプロセッサ間でデータを同期させるためにもエネルギーは消費されるため,プロセッサ・ダイ上でのデータ移動に関するエネルギーの最適化も性能向上に寄与する.

 まずはここまでが昨今のマイクロプロセッサの性能を考える上での基本的な原則である.

 1971年に最初の商用マイクロプロセッサ「Intel 4004」が登場して以来,マイクロプロセッサのアーキテクチャは複数の系統が生まれては集約したり分岐したりを繰り返し,今も統一されていないし,これからもそうだろう.なぜか.プロセッサが単一のアーキテクチャに集約する可能性のあったイベントとして,歴史上,最も示唆的なのは,1980年代初頭カリフォルニア大学バークレー校とスタンフォード大学パロアルト校で開発され,C言語,UNIX,大学などの研究成果を基に,それ以前の複雑化したCISC(Complex Instruction Set Computer)への反動としての新たなオープンなアーキテクチャパラダイムを作ったRISCマイクロプロセッサである.MIPSの設計者ステファン・プルジブスキによれば,RISCとは「1985年以降に設計されたあらゆるコンピューター」である.

 RISCプロジェクトは同時代やそれ以前のCISCプロセッサとは異なり,マイクロコードやメモリからメモリへの命令をもたない固定長の32ビット命令,大きな汎用レジスタ,パイプラインなどの第2第3世代のマ イクロプロセッサを定義する特徴を備え,1命令あたりのクロックサイクル(CPI)を一般的なCISCの3~4サイクルに対し1サイクルに短縮した.大きなレジスタファイルベースの設計は,コンパイルされたプログラムの命令使用特性を徹底的に分析し得られた”頻繁に使用される命令のサブセットは極めて限定的である”という洞察によるものである.RISCが開発されるとインテルやモトローラなど当時のワークステーションメーカーは自社のアーキテクチャを捨てて独自のRISC CPUを設計し,それらは驚くほど互いに似ていた.従来のアーキテクチャとの互換性を必要としないことから,ARMや日立製作所など組み込み用のニッチな用途をターゲットにしたRISCベンダーが登場した.RISCの思想はコンピューター・アーキテクチャーの世界で確固たる地位を築いていた.

 それでもプロセッサが分岐を続けた理由は,プロセッサの成功は技術的なメリットよりもそれを使用するシステムの数量に大きく依存することに依る.システムの数量の決定要因は市場であり,市場を決定するのはアプリケーションである.例えば,1974年にモトローラがマイクロプロセッサー市場に参入したとき,主要な用途はゼネラルモーターズやフォード向けの自動車市場だった.1974年に発表された8ビットのRCA 1802の最も重要な用途は, NASAの宇宙探索機7機であった.1977年に発表されたApple IIは表計算VisiCalcによって市場に浸透した.使用されるシステムの数量によってプロセッサの成功が決まる原則は以降も変わらない.1980年代以降のデスクトップ市場ではソフトウェア業界が次々と多くの機能を開発することで,エンドユーザーは高いパフォーマンスを求め,汎用機のためのより高性能なマイクロプロセッサの需要が増加した.そして汎用機が主役になる1980年代半ば以降では,互換性が求められるコスト重視のPC市場と,価格は二の次で性能重視のワークステーション市場に分岐する.前者はオープンスタンダードを採用し何百ものメーカーが低価格のコンピューターを生産できるようにしたx86プラットフォームによるIBM互換機が市場を席巻する中,RISCはUNIXワークステーションをターゲットにした後者に属し,両者は異なる需要を満たし共存した.さらに1990年代前半に登場した第2世代のRISCプロセッサは,ベンダごとに異なる機能が採用され,第1世代との類似点はもはやなくなり,RISC自体も分岐していく.この頃,x86もRISCの考え方を多く取り入れており,CISCやRISCの区別は重要ではなくなっていた.

 こうして需要の変遷とともに複数のアーキテクチャが生まれは,決して一つに集約しないのは,CPUの性能を上げるにはCPIを下げる,プログラムの命令数を減らす,クロック周期を短くするなどの工夫が必要であり,どれか一つの要素を減らすと他の要素が増えてしまう原理的なトレードオフがあるためである.RISC CPUの対照的な設計を表すAlpha21064とPowerPC601は,前者は高速なクロックとシンプルな命令セット,後者は各クロックで多くの処理を行う強力な命令を持ち,重視する観点次第で各々が異なる設計と特徴を持つ.性能がトレードオフにある限り究極のプロセッサは原理的に存在しないのなら,需要が分岐する限り,プロセッサもまた異なるアーキテクチャに分岐し続けるだろう.

 

 こうして,主に効率的なメモリ階層技術によってプロセッサとメモリ間の速度差のバランスが保たれてきたが,メモリ密度はほぼ2年ごとに倍増する傾向にある一方でメモリ速度向上は緩やかであるから,大規模で高速なキャッシュに依存した1980年代後半のRISC CPUアーキテクチャのように,設計や用途次第ではメモリ速度が性能のボトルネックとなる可能性がある.したがってこれらのバランスが保たれている限りでは,高性能メモリを大量に搭載することによる性能向上は限定的かつ有限である.

 

 一方,我が国の半導体製造技術は戦略性と機密リテラシーの欠如により知的財産を他国に安易に流出させてきた.特に定年等で退職する技術者の情報流出を防ぐための厳格な機密契約を入社段階で結び,中核技術はあえて特許公開しないか各国での同時知財化を徹底するといった基礎的な情報機密化措置を民間企業の自主性に委ねず法的規制で義務とすることは,国策として検討に値する.

 半導体産業を焼野原から作るには,装置材料分野の国内資源や生きた研究資源を活用しつつ,プロセッサの成功とは使用するシステムの数量に依存するという原則を踏まえ,上述した統合システム,例えばソフトウェアルーチンの固定機能コア化を実現するシステムプラットフォームを開発しながら,同時に10nm未満の設計ルールを実現する半導体ファウンドリーをも兼ね備えた企業を,既存企業でなく新たな新興企業として経済的に支援し育成していくことが望まれる.その前提段階として,産業を牽引する潜在的人材層への啓蒙,すなわち希少な学術エリートコンピューター人材を,流行に捉われず本質的な価値の創造へと向かわせる価値観の醸成,コミュニティが鍵になるだろう.

 

 

 

自然と人工物

 

自然と人工物は相克してきた。少なくとも近代的な価値観では。

“例の問題”に再び向き合いはじめ、昨年初頭前稿を書いてからしばらく経った頃、ひとつの仮説を見出した。詳しいことはここには到底書くことができない。やや具体的には、進化のより進んでいることを示唆する信号、自然物とそうでないものを区別する信号、そしてそれらを支配する情報の保存と伝達のシステム、とりわけ、知能を持つ生命やその身体の発する振動あるいは草木と風の送受信する振動。かつて、生態学者の間には森は安定状態、あるいは復元性=resilienceを全体最適化するひとつのリダンダントなシステムであるという理論があった。現象にはメカニズムがあり、鳥や人間の歌もまた、系のルールに従っている…。昨年冬はマウイ島やメキシコ湾に、必要なデータを採取しに行くことを計画し航空券も手配したところで機会を逃し、そうこうしているうちにパンデミックで空路が途絶え、極東の奇妙な形をした島に隔離されてしまった。

2019年1月の前稿20年後の世界と取り残される人々 激動の時代の始まり、塗り替えられる勢力図』では中国をめぐる脅威、既に2014年には世界一だった購買力平価(PPP)ベースのGDPと、増大する経済力・技術力を背景に南シナをはじめ急速に軍事力を拡大していることを書いた。それから日本国内でこの問題を案じるような人物にはついぞ出会うことはなかった。

前稿から1年半の間、世界はさらにどこかの地に歩みを進めた。昨年4月に香港では逃亡犯条例改定案を契機にデモが過激化し、今年6月に香港国家安全維持法が可決、香港での反中国的言動の自由は事実上禁じられた。1月には習近平が一国二制度による対台湾政策を提示、蔡英文はこれを否定、その後蔡は台湾総統選に勝利したが、今も統一か独立宣言による武力侵攻かの危機に晒されている。昨年3月には米ソ冷戦後初の特別な危機委員会となる「Committee on the Present Danger: China (CPDC)(現在の危機委員会:中国)」が米国で設置、今年8月には中国ファーウェイ社製の通信機器にバックドアが仕込まれているとし、関連企業への禁輸措置を強化、米国からの半導体やソフトウェアの同社への供給を全面禁止した。世界はすでに冷戦の様相を呈している。

私たちの社会は、2050年までに高密度化する都市とロハス的理想郷としての陬遠地域の二局構造に収斂していくだろう。今とりわけ九州のある地域を足がかりに検証している。二元論的な、あるいは要素還元主義的な、文明というある種の生態系システムへの再考に、人間社会は直面する。そのことは人間と、ネットワークを流れる情報を含む、人間以外のあらゆる全てとの関わり方について再考の機をもたらした。今から17年前、高校三年の時、この近代合理主義への問題を懐柔できず彷徨する羽目になった。森や草木の遠望される形態は、高解像な4K映像を通じて、45億年の進化に裏打ちされた、圧倒的な正義として表示される。ピクセル密度の変化は「画素数」という一見してリニアな量的変化を超えて、何か質的な変化を私たちにもたらしているように思える。周波数知覚の認知が可聴域限界を閾値として、いわば「相転移」するかのように。そうして見える空撮映像は、文明という人工物の「玩具」に過ぎないことを露呈してしまった。

人間が自然と仮に区別されるというなら、自然に人間という存在が勝るのは、おそらく時間の意識においてだろう。シリコンバレーでは、1台も車を販売していないEVの企業や、殆ど誰も何をしているか不明なデータ分析企業が、この数週間の間に上場した。これはある意味での、すなわち現代の「芸術」の構造そのものだ。モダンアートとは、人間の作り出すポイエーシスを、オークションで落札するほど価値あるものと信じ込ませる行為に他ならない。皮肉なことに、知能をもった生き物は脳内に現在と別の瞬間をシミュレーションすることができるので、それが夢となる。
そして人は夢に資源を惜しまない。
 
それはあなたの子孫であるかもしれないし、何か普遍的な問題であるかもしれない。
 
 
 
 
 
 

3つのキーテクノロジーと近い将来の予測

1. Webブラウザが相対的な重要性を増す

Web上のソフトウェアインターフェースの多くはJavaScriptによって書かれている。これは多くのWebブラウザがECMAScriptとして標準化された仕様に準拠し実装されていることに依る。一方でJavaScriptには決定的な速度的制約がある。
高速化を阻んでいる最初の要因は実行時に機械語に翻訳される点である。JITコンパイラが登場しインタプリタ方式の時代から比べて高速化したが、事前にコンパイルされ最適化されるネイティブコードの実行よりもはるかに遅い。通常ネイティブ言語で書かれたソフトウェアは環境(特にCPUアーキテクチャ)に依存するのでオープンなWeb上のアプリケーションを記述するのに向かなかった。
もうひとつの原因は言語仕様上の特性にある。動的型推論、擬似的なクラス、配列の不在により柔軟性がもたらされている反面、実行時チェックによるオーバーヘッドが常にかかかる。
こうした速度上の問題を解決するために各ブラウザベンダーは様々なアプローチをとっている。MicroSoftは静的片付けやクラスの拡張機能を持ったTypeScript、Mozzilaはasm.jsという形でより最適化されたJavaScriptにより高速化させるという方針を進めている。一方でGoogleは同様な傾向のDartに加えてコンパイル済みのネイティブコードを直接ブラウザ上で動かすことのできるPNaClを推進している。これはLLVMにより生成された中間コードを配布実行することで第一のボトルネックであるマシン依存とネイティブコードによる実行速度のトレードオフを解決するものだ。
こうした傾向が進むことでブラウザ上のWebアプリケーションとこれまで端末に依存していたネイティブソフトウェアとの実行速度が縮まり、Web上でダウンロードした大規模ソフトウェアをそのままブラウザで実行することが一般的になる。ChromeBookはまさにこのような未来を想定してデザインされている。

2. マイクロマシン(ナノマシン)技術が日常を覆う

組み込みコンピュータはすでに私たちにとって身近なものとなっている。例えば信号機、自動販売機、家電、車などありとあらゆる機械は今や内臓コンピュータの助けなしではあり得ない。一方でこれまで機械加工により製造されていた各種構成デバイスがフォトリソグラフィを中心とする半導体集積回路製造技術により制作される小型のMEMS(Micri Electro Mechanical System)に置き換わっている。MEMSは従来の機械構造を集積化しシリコンウェーハ上に構成するもので、東北大学の江刺正喜氏が世界的権威である。特にマイクロセンサや通信モジュールの小型化高性能化によりこれまで実現できなかった高度なデバイスが構築できるようになってきている。さらにFPGAまたはPSocといったプログラマブルなマイクロコントローラは従来回路図上で行っていた回路設計や論理合成をソフトウェア上で実現可能にし、ちょうどWebコンテンツの制作が民主化したのと同様な現象が起こる。これにより多種多様なデバイスが世の中に溢れ、私たちの日常的な環境はマイクロマシンで埋めつくされるようになる。ウェアラブルコンピュータという言葉はこの傾向の一面を切り取ったものに過ぎない。

3. 分子コンピューティングと人工知能の基礎が芽生えはじめる

今日のあらゆるIT技術は人工知能に向かっているとも言える。それは一言で言えば人間が避けるべき仕事を人間よりも高いパフォーマンスでこなしてくれる存在だ。AppleやGoogleは来るべきこの未来のためにテクノロジー企業を買い漁っている(ように見えないだろうか?AppleはともかくGoogleは間違いなくyesだ)。
しかし人工知能の実現にはコンピューティングの更なるパラダイムチェンジが必要である。2004年のIntel Pentium4を最期としてプロセッサ単体のクロック数上昇は止まり、(並列処理による進歩は続いているが)これは電子回路によるコンピューティングの限界を示唆している。コンデンサの集積密度が上がるほどに電力と発熱の問題が深刻化するためだ。
そこで次世代のコンピューティングは量子コンピューターに委ねられるという世論があるが、近い将来より実現の可能性が高いのは量子でなく分子によるコンピューティングだと思われる。量子コンピューターには依然解決困難な壁が多くあり、また特定の演算向けとなるのに対し、ナノテクノロジーによる汎用的な分子コンピューティングの基礎研究はすでに一定の段階に入っている。1kgのラップトップPCサイズの物質が10の25乗個の原子を含んでいるとすると、潜在的には10の27ビットのメモリを保存でき、また過去1万年の全人間の思考に相当する計算を10マイクロ秒で実行可能な能力があると言われている。
ソフトウェア分野での鍵となるのはパターン認識とそれによる機械学習アルゴリズムでありこの手の研究は方々で行われている。ソフトウェアの性能はハードウェアと日進月歩なので詰まる所コンピューティングの進歩次第となるがこの萌芽が近い将来顕在化し始めるだろう。

Be first, Be smarter, Cheat

2012-01-26 16.47.48 HDR

東京に帰ってから二ヶ月が経った。
複数の事情が重なって春になるまでは日本にいなければならない。

私の友人であり同時にアメリカにおけるメンターでもあるチャドはPayPalのファウンダーの一人であるPeter Thielをクライアントに持つ投資会社のアナリストで、前歴はフォトグラファーとしてインターネット業界に関わった後ハーバードの大学院でファイナンスを学びVCやPrivate Equity業界に転職した。

彼がWestfieldのカフェで話してくれた感動的なアドバイスを忘れないように書いておこうと思う。

「ビジネスを成功させるには、次の3つの鉄則がある。
“Be first、Be smarter、Cheat”
カズは最初の2つは大丈夫だから、あとは最後だね。この辺は中国人がとてもうまい。僕も前の会社にいたときは会社には内緒でインターネットビジネスをやっていたんだ。

僕の祖母は一昔前にすごく成功した経営者で、Landonっていうファミリーネームは祖母の家系のものなんだけど、彼女が僕によく言っていた言葉がある。どんなものでも売れるんだって。

これは僕がフォトグラファーをやってたときに関わっていたwebサービスで、観光業者向けにハワイとかリゾート地の写真や動画を販売するサイトなんだけど、このハリネズミの動画ひどいだろ?これ僕が撮ったんだけど、本当にひどいよね。でも売れるんだ。

このサイトは最初の年は購入してくれたユーザーは0で、次の年は10人だった。その次の年は50人くらいだった。

もうやめようってことにもなってたんだけど、徐々に写真や動画の素材も増えてきて、5年目あたりで一気にユーザーが数千人に増えて売り上げもそれなりの規模になって、最近他の会社に売却したんだよ。どんなサービスも売れるまでには5年くらいは必ずかかる。

これ見て、HDの最高画質のだと100ドル以上もして誰が買うのかって思うよね。でもほら、これを見ると12人も買ってる。

こんな動画でも誰かにとっては重要で、買う人がいるんだよ。」

日本のメディアにはセレブリティという概念がない

今月はロサンゼルスにあるスタートアップハウスに籠ってプログラムを書いている。オンラインスポーツネットワークのスタートアップを経営するジョーダンが、親戚が所有する別荘を最大十名程度が寝泊まりしながら作業ができるように開放しているもので、オフィスはプールやバスケットボールのコートがある庭の一角を占めるガレージを改造した部屋から1分足らずで行き来出来る場所にある。(それにしてもアメリカのスタートアップ関係者は本当にガレージが好きである)ロサンゼルスといってもワーナーが近くにある、かなり外れたところにあるので車を使わない限りどこにも行くところがない。サンフランシスコでは毎晩のようにスタートアップ関連イベントかまたはサルサに通っていたので、生活はがらりと変わった。来月は再びサンフランシスコに戻る。

 

日本のメディアにはセレブリティという概念がないと思う。むしろ格差を隠蔽して総中流を演出するのが日本のメディアの目的の一つだという指摘もある。例えば国内でも有数の俳優が街中の庶民的な店で飯を食い、上手そうな演技をする。たとえ本当に上手くとも、そこに据えられた意味は、私と君達は一緒だというメッセージである。

2000年初頭のITバブルの頃、初めてメディアの中にセレブリティが登場する。つまり大衆とは異質な存在であることを公に主張する者が現れる。新種の存在が現れるときには必ず象徴というものが必要で、六本木ヒルズはその役割を果たした。

要するに日本におけるITバブルの終焉とは、メディアの中でのセレブリティという存在を改めて否定し、高度成長期の旧来の価値観に揺り戻す儀式となった。運動会で全員手をつないで一斉にゴールをするという話があったが(想像しただけで気分が悪くなりそうだ)、皆で一斉に幸せになるというコンセンサスに希望を持てないのは、それが既に嘘であることに皆気づいているからだろう。ヒルズがITバブルの頃の新種のセレブリティを象徴したように、世代交代による新陳代謝を繰り返しながらいつの時代にもメディアに現れ続け、スーパーマーケットのゴシップ紙に顔が並ぶハリウッドのセレブのような存在は、たとえ世界が狂い始めようともこの国には新しい成功がどこかにあるということの象徴としてあり続けている。

 

野生の思考

サンフランシスコ電子音楽祭り

先月台北にいたときには約1年ぶりにゴルフをして、改めて奇異なスポーツだなと思ったのと同時に、アングロサクソン的だとも感じた。クラブに球を当てるときの初動が全てで、後は飛んでいく球に委ねられる。米の栽培や茶のようにプロセスに手を尽くす文化をもった日本人にはこういうスポーツはスポーツとして成立させられなかったはずである。

 

日本には本当に何でもある。何でもあるというのは、必要なものが全て揃っているというよりもごく稀にしか必要とされないものですら流通していて、割と簡単に手に入るというニュアンスに近い。ここアメリカではあれば便利だがなくてもどうにかなるものは多くないし、誰が買うのか全く想像がつかないようなものはあまり売っていない。

何でもあるということは本来ポジティブな面であるはずなのだが、しかしそれらを生産するのに使われる膨大な人的資源を考えれば実際にはデメリットとなっている。明らかに非効率だからである。日本人の勤勉さはかなりの部分が余剰的な価値単価の低いものに使われ、それはゴルフで言うところの初動がいたるところで誤っているからに他ならない。

これを正す最善の手段は学術的な水準を上げる以外にはないだろう。

 

 

9月の第二週にサンフランシスコ市内で行われた電子音楽祭では、いい意味でなく現代芸術化するシーンの一端を見たような感慨を受けた。

少なくとも以前はcomposeとはパズルのピースを一片の狂いもなく埋めるパーフェクトデザインを指していた。今はcomposeとdesign(DJ)の境界が曖昧である。複雑さと微細さが人間の考案する組織-システム-に追いつかなくなったために、そして記録と再生が遥かに容易になったために、かつて主流であった”完成”という態度を暫定的にでも諦めてやり過ごしている。抽象絵画の黎明期にはサロンでは常識的な態度であるFiniに対立した作家が新しい時代の勃興を勝ち取っているが、根本的に視覚芸術と原理が異なる音響芸術との比較はできない。レヴィ=ストロースの言葉を借りれば「栽培された思考」であるところのcomposeと「野生の思考」であるdesign、要はブリコラージュのような方法こそが主流になっていくのであろうか。

 

そういうわけで、こうした時代にあっては、構造のための理論的な支柱がないがゆえに必然的に見堪えのあるところは音の生成の過程となる。その意味で際立っていたのはJemes Feiだった。彼は台湾出身である。 現代的な楽器のインターフェイスはしばしば、アウトプットと身体性との距離が大きいのでコントロールがより難しい。そしてコントロールを諦めたことが露呈したその瞬間、興が冷めるわけである。身体性から切り離されるほどに、そして情報エレクトロニクスの技術が進んだ結果考慮すべき要素が次第に複雑かつ微細になるほどに、音は人間のコントロール下から当然離れていく。Jhon CageのChance Operationという概念はまさにこのコントロール不能となりゆく傾向に対し、それでも人間はコントロールしているのだと言い張るアカデミックな権威の皮を借りた正当化を許されようとする諦めに他ならない。 こうした一時しのぎを通過しながら、歴史は次なる概念を導入する必要に迫られる。

 

近年の傾向を集約して延長すれば和声と旋律が融解し音程感から自由になった「ビート」のようなものに集約されていくのだろうか。だとしたら、あまりに退屈である。

集合知はオーガナイズされる段階に進む

World Wide Webの生みの親であるティム・バーナーズ・リー氏も指摘するように、個人情報が漏洩する危険性は日に日に強くなっている。ソーシャルネットワークにポストする情報はもちろんのこと、ネットワークに接続されている限り我々の位置情報は逐一記録されているし、昨年話題になったようにスマートフォンは指の動きを常に記録している。米国では50以上の団体が小型カメラや赤外線を装備した無人機の利用を許可されている。

こうした合意なしに取得されてしまう情報を恣意的に削除したり堰き止める手段はサービスやデバイスを使わない以外に今のところほぼないので、個人でできることは余計な情報を自ら流さないようにするくらいだろう。

今はまだ個人データの利用方法が成熟していないので事態は表面化していないものの、遅かれ早かれ騒がれることになる。集合知が「集める」段階からオーガナイズされるレベルに今後進むのはほぼ間違い未来と言えるからだ。
つまり個人がなんらかのインターフェイスによって入力したデータ(本人がいとしようがしまいが)によって次なる価値を生み出す試みである。

ソフトウェアにおける機能と芸術性

今世界で最も注目すべき話題はBRICS銀行の動向だろう。東京にいるとそんなこととはまるで無縁のように感じられてしまう。メディアを中心にそういった世界の大きな風の流れをセルフディフェンスのようにふわりと何事もないかのように受け流す在り方がこの国の閉塞感を作り出すひとつの要因になっている気がしている。ドル中心の経済は数年後には大きく様変わりしているのだろうか。

ところでソフトウェアにおける機能とは車にとってのエンジンやステアリングといったものに過ぎない。
すべて揃って動けばそれは車と呼ばれるがそれだけでは車でしかない。だから私たちは多様な車を生み出し、選ぶ。シート、ハンドル、ペダルの位置関係やハンドルを切る重さ、エンジンの音、サスペンションの効き具合、そうしたものをトータルでイメージして具体化するということがソフトウェアにも求められるはずだがそういったデザイン性、つまり体験をデザインするということがあまり重視されていない。このデザインは技術と深く関わっている以上いわゆるデザイナーというよりむしろエンジニアこそ手がけるべき領域である。もっとソフトウェアが芸術であるという理解がされていいし、エンジニアはアーティストと認知されるような仕事をしていかなければならない。
そしてそれができるのは多くの場合個人である。

書評『The Lean Startup』

20120421-170701.jpg

あなたのプロダクトにある問題が起きていることに、あなたは気づく。そこであなたはこう考える。

Can we built a solution for that problem?

答えはYesだ。さて、この問題解決に着手しよう。。。

知っての通り起業家のためのバイブルとして各国で圧倒的に支持される本書は日本でも邦訳が出るらしいが原著を先々月頃から読んでいたので、一足先に書評を書いておこうと思う。と、書ければベストだったのだがもう出ているらしい。
原著で読む場合はAudible.comで著者Eric Ries本人が読んでいる朗読が手に入るのでこちらもお勧め。

要旨としてはスタートアップビジネスにとって、早めにMinimum Viable Productと呼ばれる最低限の必要機能を備えたプロトタイプを世に出し、サービスの作り手の想像の範疇で試行錯誤するのでなくユーザーが真に望むサービスへの改良をフィードバックループの中から探れというもの。Lean methodからすれば冒頭に書いた問題解決のプロセスからは3つの問いが抜けている。

1.Do consumers recognize that they have the problem you are trying to solve?
2.If there was a solution,would they buy it?
3.Would they buy it from us?
4.Can we built a solution for that problem?

つまり限りあるリソースの中で着手する前に顧客が望んでいるか。
言うはたやすいが、一度でもプロダクトを世に問わせたことのある人であれば、行うに難い場面をいくらか想像できるのではないか。可愛い我が子のデビューはスティーブジョブズのプレゼンテーションのように完全に整えられた状態で飾らせたいと思うのが親の常であるだろうし、本書にも書かれているが皮肉なことにユーザー数も収益も少しあるより”ゼロ”の方が人は可能性を感じるので、作り手含む関係者各位の期待を裏切るまいという心理が働けば完成品への拘りが尚更生まれる。
膨大なコストをかけて完成させたプロダクトや新機能が蓋を開けてみたらユーザーの望むものではなかったという著者のIMVUでの苦い経験(実際には投資家や従業員からのプレッシャーを考えれば相当な苦難だったに違いない)から語られる教訓には相応の説得力が込められている。

アントレプレナーが直面する各フェーズに沿って本書は進行していく。米国一のオンラインシューズストアでAmazonに好条件で買収されたZaposやHP、Facebook、Dropboxなどシリコンバレーのスター企業がフレームワークのテストケースとして次々と挙げられ、Zaposについてはトニー・シェイ『ザッポス伝説』がこれまた面白いのだが、アメリカ最大のオンラインシューズストアもはじめは小さな実験からスタートしている。オンラインで靴を買う需要が本当にあるのか試すために、ネットでオーダーが入ると靴屋から商品を全額で買い取り郵送で送るという地道な作業を繰り返した。
本書ではこの過程を著者が説くフレームワークの一部を当てはめ、それがどうプロダクト改善のためのプロセスに有用だったかを解説している。

本書の何が新しいのか。全て想像できる範囲内にあるという意味においては正直これといって新しいことは何もない。ただあまりに有名になった数々の成功神話と固定観念と、そして創造者であるがゆえに持つ衝動から離れ、泥臭くも賢明な創造の舞台に上がる前の手人文字としてこれ以上のものはないだろう。NIKEのキャッチコピー”Just Do It”式のギャンブルでなく再現可能な科学として抽象化できる教訓はこれが限度ではないか。私たちが知っている美しいプロダクトはそのプロダクト程美しくないプロセスで生まれている。