コラッツ予想の確率論的考察

前回virsion.3まで分かったこと

・コラッツ経路はloopしない。
・yellow cellの連鎖は有限回で停止する。

しかし、「yellow cellの連鎖が有限回でもnot yellow cellを介せば数列が発散する可能性を排除できない。」という所まででした。

再考察してみたのですが、やはり非線形非可換であることがこの問題の障壁であると感じました。

そこで取るべき選択枝が2つ見えました。

一つ目は非線形非可換演算における証明を模索することです。
間も無く、このルートはかなり厳しいと推定されました。そもそも数学において非線形非可換演算の研究は日が浅く道具立てされていないという感もありましたが、例えば素数を見つける方法を言葉で表すと

2から始まる自然数列から初項を出力する→その初項の倍数を自然数列から取り除く
→その自然数列から初項を出力する→その初項の倍数を自然数列から取り除く→・・・
の繰り返しです。

コラッツ予想は偶奇に対しての分岐条件や2で何度割るかなど一貫してないため複雑であり、素数に関する問題ですら難解なので途方に暮れてしまいます。

二つ目は非線形非可換のなかに線形可換部分を見つけるという方法です。もしかしたら命題を解くにはそれで十分かもしないからです。

線形.png

そのステップとして以下の経路に着目しました。色付きcellの逆路を進む場合を考えます。

分岐.png

左の経路がnode-、右の経路は行を移動してからyellow または magenta cellへ移動する事を示しています。

次に任意の初項aから可能な限り左右交互に逆路を進んでいきます。
(下図の例で初項は34。下から上に進むのであって矢印の事でない。)
leefに突き当たる場合は、左の経路を進むということを繰り返します。すると紫の矢印で示した減少列があることがわかりました。

減少列.PNG

一見すると1へ収束しそうですが、22→34のようなyellow 2 chain(以上)あると減少列は停止してしまいます(magenta chainでは減少が続きます)。
非線形非可換の中に線形可換部分を見つけることできましたが、これに関して進展しませんでした。

証明のためには何より1へ収束しない数列の存在を否定することが条件であるので、その数列の構造について詳しく調べようと考えました。

コラッツ経路の順路に関してyellow cellは数を増加、not yellow cellは数を減少させる性質があるのですが、逆路では関係性も逆になります。
上りn°の勾配は下りn°の勾配でもあるので、順路で増加率が大きいということは逆路では減少率が大きくなります。1へ収束する数列は順路では減少率が、逆路では増加率がnot yellow cellの方が一貫して大きいことで説明できます。

つまり、両端で発散する数列はyellow cellとnot yellow cellが最小値を挟んで増加率(または減少率)の優劣が逆転する数列になるという訳です。

ryoutann.png

ここまでのコラッツ経路に対してのイメージはyellow cellによる数の増加、not yellow cellによる数の減少のせめぎ合いという抽象的な印象だけで、どちらかに軍配が上がるのかはさらに具体的に数値化して調べる必要があると考えました。

それから増加率・減少率に着目して計算すると必要な演算は掛け算・割り算のみであったため非線形という障壁はとりあえず壊すことができたようです。

ここからは論文virsion.4の補足説明していきます。
タイトルが内容と合わなくなったのでシンプルなものへ変更してます。

p.8 table 4:
yellow chainの出現頻度について調べてみた所、n chainは2^{n+1}周期ごとに出現することがわかりました。これはnot yellow cellの各初項の出現頻度に酷似してます。

そこで同周期に出現するyellow cellとnot yellow cellを対応させて増減率について計算してみるとmagentaの場合を除き減少率の方が大きい事がわかりました。

増加率(a)<減少率(b)

※p.9で増加率=(減少率)^-1と定義してます。

また、出現率を分母に取るとyellow cellおよびnot yellow cellが現れる確率となります。
十分大きな初項では、table 6:1 chain & magenta の増加イベントが他の減少イベントにより打ち消され1へ収束しそうです。

しかし、これは独立試行の確率に基づいての考察であり証明することは不可能なのではないかと考え始めました。

独立試行とは前の試行が後の試行に影響を与えない確率の事を言います。
以前この確率に関して悩んだことがあり、うやむやになってたのでもう一度考察しました。

例えばサイコロの目の出る確率1/6は十分な回数の試行をしたときの各目の出る割合とも解釈できます。であれば「あまり出ない目は出やすくなるのだろう。」と以前考えてました。
サイコロ君が試行を記憶していてこんなことを思っているのでしょうか。
「しばらく3が出ていないな。そろそろ出してやるかなぁ。」
でもそれだと前の試行が後の試行に影響を与えていることになってしまいます。

シンプルな例をもう一つ。田中君がサイコロを振り、三回連続して5の目が出る確率を考えます。答えはもちろん1/6^3です。
では5の目が二回連続して出たところで斎藤君を呼んできて三回目の試行をします。三回目の試行で5の目出る確率は田中君にとっては1/6^3、斎藤君にとっては1/6になるのでしょうか。
立場によって確率が変わるというのもおかしな話です。

結論を言うと確率論は基本的に未確定な事象に適用するものということで説明できます。
つまり田中君がサイコロを一回も振ってない時点ならば三回連続して5の目が出る確率は1/6^3であり、
二回振った時点で次に5の目が出る確率は1×1×1/6となります。確定事象は1になるという答えを得れば当たり前だと感じます。
先の例は難しいですが、5の目が2回の事象で2回連続して出る確率と200回の事象で200回連続して出る確率は試行回数に対して反比例的であり、分母がとても大きくなる十分な試行回数に対して、連続して目が出る出ない事象等は相対的に些細な事象になるからと考えられます。

話を戻しますと、独立試行では限りなく100%に近くコラッツ数列が1へ収束することがわかったとしても、100%でないと証明したことにはならない数学の厳密さが要求されるからです。
しかし無数にある経路を一つ一つ調べ上げるのは無理があるので、やはり確率でアプローチするしかなさそうです。このジレンマは解消できないと思った矢先、従属試行なら道が開けるのではないかと考えました。(この時点で独立・従属試行という言葉はわからず調べました。)

従属試行とは独立試行の反対で前の試行が後の試行に影響を与える確率の事を言います。例によってサイコロを振る場合、既に出た目はノーカウントとすると、確率の過程は

1/6×1/5×1/4×1/3×1/2×1

であり六回の試行に制限され、最後の確率は1であると断定できます。何回でも同じ目が出る可能性がある独立試行とは明らかに異なっている点です。

コラッツ数列はloopが存在せず、また図に示したような青と赤の重複してない経路があるので従属試行が適用できそうです。

経路.png

p.11の説明:
実際のコラッツ経路ではloopが存在せず同じ経路は通らないため重複cellを除く必要があります。

例えばnode+でred cell 352が出現すると必然的にnode-においてcyan cell 88が出現するので、node+でcyan cell 88が出現する確率は0になります。
これを考慮して重複cellを除いたもの(Aは増加率、Bは減少率)がtable 11になります。

table 12ではyellow cellを初項(y初項)としてますが便宜的なものです。(論文中では初項および終点をyellow cellにしてます。)
y初項に対して、その初項以下の全てのイベントを掛け合わせたもの(増加率累計)がy期待値(yellow cellの終点)となります。
論文に示してないですが1664256…の部分にはnot yellow cellは実際には存在しないので16には16周期のgreen、64には64周期のblueイベントを一つ余分にカウントしています。そのため24.08…×3.48、2.96…×3.48、0.04…×13.94として取り除きます。magentaのあるnode-に属するnot yellow cellの初項の出現が一つずれる補正をしてます。

table.12.PNG

y期待値はTable行数が増えるにつれて減少傾向にあることがわかります。
実際の経路は初項以下の全イベントが出現するものではないのでy期待値の意味するところが不明瞭です。そこで近い条件から考えてみました。
1へ収束するとわかっている数列では、その最大値を初項とすればその初項以下のイベントのみ出現します。27が初項ならnodeの最大値9232を初項とします。この初項における期待値として考えれば少々理解できます。では最大値を設定できない1へ収束するかわからない条件ではどうなのでしょうか。
Table行数が2^6以上の任意の初項であれば1へ収束する期待値を有していると推測できます。その理由としてyellow cellの最小値は10であり期待値がそれ以下である点が挙げられます。

ところで実際の経路ではyellow cellが10より小さくなることはなく、減少率(yellow cellも含む減少イベント)が余ってしまうので奇妙な感じがしました。これについて実際の経路は一本ではなく枝分かれしているからだと考えています。

減少率.png一方、期待値が10より大きくなるTable行数2^6以下では、初項がその(初項までの)範囲のイベントだけで1へ収束できるものが少ないと解釈できます。実際にはTable行数2^6以上の余った減少イベントによって1へ収束しているものと考えれます。またTable行数2^6以下の初項の数は有限なので十分大きな任意の初項であれば、いずれもy期待値は10以下を示し収束する余力ありと推測されます。

ここで、両端で発散する数列が存在する場合について考察します。
両端で発散する数列が一つでも見つかると、その逆路を進めば(leefもありますが、p.4より埋め尽くされていないことは判明しているので)枝分かれして経路が増えていきます。
図に示した赤丸印は両端で発散する数列全体の最小値です。その最小値を通らない経路もありますので各数列の最小値(ピンクの丸印)もあることがわかります。

両端で発散する数列

P.2の下【Collatz tree の組立て方】の手順による動線イメージが以下の図になります。
行を下にずっと進んでいきますと、まず両端で発散する数列の全体の最小値に遭遇します。次いで各数列の最小値に遭遇します。

動線.png

両端で発散する数列は1へ収束しないので、任意の初項を超えていく経路数は初項が大きいほど増えていきます。

収束しない経路数が増加すると先の説明と同様、初項までの範囲における減少率(yellow cellも含む減少イベント)は余るので1へ収束する経路数が増えると考えられます。
従属試行の観点から、任意の初項のy期待値はいずれも収束の余力ありと推定できるので、収束しない数列が存在すれば、その分、収束する経路数を増えるので両端で発散する数列の経路数は増加傾向にはならないのではないかと推測されます。

しかし両端で発散する数列が存在するならば初項が大きくなるにつれて経路数が増加するので、排反事象でありえないのではないかという説明をProof 11に書いてます。

途中から、ざっくりとした考察なのですが取り敢えずこんなところです。

コメントを残す