5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

圧縮アルゴリズム考えたんですが

1 :謎のばか:03/01/06 06:46
まぁ見てください。

数字列:92,95,21,86,32,65
1.まず、一個飛ばしのデータを並べていく。
  92,21,32,95,86,65
2.隣同士を比較して大きいほうが小さいほうの3倍より
  大きいとき(大きい方 ー 小さいほう)をする。
  71,21,32,95,86,65
  ここで数字を引くことができれば1に戻って繰り返す。
  これ自体圧縮しませんが、文字列を偏らせる効果があります。

しかしこのままだと、一回引いた数字が、
それ以上引けない数字になったとき、復元の時にばぐるんです。
やっぱりシャノンのいってることが正しいのかな。
理解できるかどうかわかりませんが、みてください。

ttp://www.h4.dion.ne.jp/~pc-pow/test.lzh


2 : ◆vp/58lzmEY :03/01/06 07:27
40分も過ぎてるのに2get

先生、質問です
>数字列:92,95,21,86,32,65
て書いてるけど、数字列じゃ無いときはどうするの?

3 :デフォルトの名無しさん:03/01/06 07:34
1バイトが0-255と考えればオケ。

4 : ◆vp/58lzmEY :03/01/06 07:42
>>3
なるほど、それでunsigned charなわけですね
最終的な計算としては、数字列が大きい順に並ぶと・・・
でも、そーすると、先生の1個飛ばし手法では2バイト文字(全角)では
意味不明な並びになるんじゃ・・・

5 : ◆vp/58lzmEY :03/01/06 07:45
コンパイルしたら、文句言われました
warning C4101: 'i' : ローカル変数は 1 度も使われません。
main()で宣言したiを使ってないって怒られましたけど・・・・


6 :デフォルトの名無しさん:03/01/06 07:56
大きい方 ー 小さいほう をした後に復元できないだろ.
必要な情報が失われてるから シャノンの定理を越えて圧縮(?)できるけど,
情報が失われてるから復元できない.
どこを引き算したか覚えておけば復元可能だけど,その情報の分が増えるので
シャノンの定理の通りになる.

7 : ◆vp/58lzmEY :03/01/06 08:02
プログラマーってすごく頭いいんですね
シャノンの定理ってはじめて聞いたけど、しらべたら難しくて・・・
シグマとか対数関数とか・・・頭痛い(^.^;

8 :謎のばか:03/01/06 08:03
>>5
ちょいバグってるぎみ
自分で治して。

9 :謎のばか:03/01/06 08:05
この方法で音楽などをエンコードしてLZHなんかで圧縮してみ。
Nの値を増やせば時間かかるけど、値が偏りやすい。
メモ帳で開いたらわかるのね。

10 :デフォルトの名無しさん:03/01/06 08:08
>>9
デコードできなきゃ意味なし。

11 :謎のばか:03/01/06 08:10
>>10
だからデコードできるようにしてほしいンダヨ

12 :デフォルトの名無しさん:03/01/06 08:12
完成したら俺が特許取るから早く作れよな。

13 :謎のばか:03/01/06 08:15
わしはこれでいーしゅうかん悩んだ;;

14 :デフォルトの名無しさん:03/01/06 08:17
>>11
デコードできるようにしたら値の偏りがなくなるけど。

15 :謎のばか:03/01/06 08:18
>11
??デコードでもとのデータ列に直すのよ。

16 :デフォルトの名無しさん:03/01/06 08:18
>>12
2ch で「公知」されてるから無理じゃないのか?
ま、 >>1 のでは使い物にならんので >>12 が自力で完成させれば特許取れると思うけど。

17 :デフォルトの名無しさん:03/01/06 08:26
その手の不可逆圧縮(?)だったら
del file とか rm file とかした方が速くて圧縮率(?)も高い、と。

18 :謎のばか:03/01/06 08:26
もうひとつ同じ大きさのバッファを作って、
すでに引いたなら、そのバッファに1を入れる。
後はこれを圧縮して(huff or range etc.)書き込む。
これどうよ。

19 :sage:03/01/06 08:27
並び変えは可逆なんだから, 引き算した場所をどうにかして記憶しとけばいいんでしょ.
毎回の引き算した場所のインデックスをヘッダに0区切りで覚えておくとかは?
あと、大抵の可逆圧縮は値が近いだけではダメで同じでないと圧縮できないので、
そんなに圧縮率は期待できないのでは? まぁ数値が近ければ同じ値になる確立も
上がるだろうけど。
それなら文字列よりも画像とか、連続的なデータで不可逆でもいいやつの方が効くんじゃないのかな。
DCTとか。

20 :謎のばか:03/01/06 08:28
>>17
不可逆圧縮なんていわれた。(;o;)


21 :謎のばか:03/01/06 08:30
>>19
大体復元できればいいってこと?

22 :デフォルトの名無しさん:03/01/06 08:30
もうひとつ同じ大きさのバッファを作ったら容量が2倍だろ。


23 :謎のばか:03/01/06 08:31
だから、0と1のデータだから圧縮したら何とかなる?

24 :デフォルトの名無しさん:03/01/06 08:37
そんなこといったらパソコンの中身は全部0と1です。
1バイトのデータに0と1しか入っていなければ圧縮できるけど、
そんなことする前に1ビットごとに0と1を入れておいたほうが容量は小さい。
それに同じ大きさのバッファに0と1を入れておいても、並び替えをしてるから、
どのタイミングで引き算をしたかわからないので、それだけはダメで、
一つの考えとしては 適当な数値を入れておいてデコードで並び替えるたびに
デクリメントして1になったら引き算のデコード(足し算)を行う。 とかいうように
すればできそうだけど、そしたらやっぱり容量が2倍です。

25 :デフォルトの名無しさん:03/01/06 08:39
結論が見えた議論をしているスレはここですか?

26 :デフォルトの名無しさん:03/01/06 08:43
結論は秘密ですか?

27 :謎のばか:03/01/06 08:46
とにかくデコードできればいいの

28 :&rlo;&lro;:03/01/06 08:48
もうだめぽ

29 :謎のばか:03/01/06 08:49
そんなこたーない
いちおうデコードできるとこまではいった。

30 :&rlo; &lro;:03/01/06 08:52
じゃ、かんせい

31 :謎のばか:03/01/06 08:53
それだと200倍ぐらいになっちゃう

32 :デフォルトの名無しさん:03/01/06 08:54
おめでとう

33 :謎のばか:03/01/06 08:56
よし。
これでVectorにだすか

34 :デフォルトの名無しさん:03/01/06 08:57
ばかも休み休みにYEAH!!

35 :謎のばか:03/01/06 08:59
あっ
限界のところで

out[i] += out[i + 1];

out[i + 1] += out[i];

どじゃ?

36 :デフォルトの名無しさん:03/01/06 09:00
>>33
小学生〜中学生の冬休みの自由研究課題(あるのか?)だったら
それなりに評価してもらえると思われ。

37 :デフォルトの名無しさん:03/01/06 09:05
ごめん。関係ないけど歌丸さん危篤。
http://tv3.2ch.net/test/read.cgi/geinin/1041566708/7


38 :デフォルトの名無しさん:03/01/06 10:34
まじかよ歌さん。。。

39 :謎のばか:03/01/06 12:37
はぁこのすれも終わりに近づいてきたなー。

40 :デフォルトの名無しさん:03/01/06 18:33
このスレが1000逝くまで歌さん逝かないでくれ・・・・

41 :デフォルトの名無しさん:03/01/06 22:28
1000 いく前にこのスレが dat 落ちしたら
歌丸さんは死なないのかもしれない。いつまでも

42 :デフォルトの名無しさん:03/01/06 22:42
一度でイイから見てみたい。コドモのマンコ

43 :デフォルトの名無しさん:03/01/06 23:32
>>37
こんな所にまで貼られてたとは

44 :デフォルトの名無しさん:03/01/07 00:21
【<芸能>歌丸 急性腹膜炎で手術】
 人気落語家で落語芸術協会副会長の桂歌丸=本名・椎名巌さん=が急性腹膜
炎のため横浜市内の自宅から救急車で同市内の病院に運ばれ、27日、4時間半
に及ぶ手術を受けた。手術は成功した。入院のため、元日からの東京・新宿の
末広亭などの初席から、約1カ月間休演する。一時は病名が定かでなかったた
め、危篤説も流れたが、28日には、一般病棟に移されるなど手術後の経過も順
調。関係者は一様にほっとしている。


45 :デフォルトの名無しさん:03/01/07 10:32
>>42
子供作れ。
俺は毎日見てるぞ。

46 :デフォルトの名無しさん:03/01/07 10:48
>>44
本当にほっとした。
よかったよかった。

47 :デフォルトの名無しさん:03/01/07 18:42
>>45
毎日オムツ換えさせられてるとか?

48 :デフォルトの名無しさん:03/01/07 20:43
>>47
むしろ率先してやってる。

49 :デフォルトの名無しさん:03/01/07 21:27
>>47
風呂はいる時見る

50 :デフォルトの名無しさん:03/01/08 15:18
んー。2ch圧縮アルゴスレは埋め立てられたか…。

>>1で述べてるのは「フィルタ」であって
まあ圧縮のための前処理よね。この場合は元の情報源より
変換後の情報量が増加するのは、可逆圧縮用途であればむしろ普通。
減った場合はエントロピー破壊を起こしたことに…。

正直、シャノンファノ理論とは関係ない。(情報源のモデル化適用をしてないし)

で。この減算フィルターは現状では正常デコードのしようがない罠。
「すべての桁について減算を行った」のなら、復元時に
「すべての桁について加算を行う」ことで復元できる。(WAVE-sub フィルタとかがそう)
ところが、引けるときだけしか引いてないので、
“引いたのか引いてないのか”の情報が欠落してると復元できない。

#変換後の値が「2:1」の場合、それがもともと「2:1」で減算しなかったのか、
#「3:1」の減算結果なのか、デコーダが判断する基準が欠けている。

そうすると少なくとも8バイトに付き8ビットのフラグが必要になる勘定だから、
ブロックソート(8バイト時3ビット)に比べれば、実現できても能率は相当落ちると思う。


51 :デフォルトの名無しさん:03/01/08 17:03
この変換だったら、すなおにwavelet変換したほうが効率がよいと思うが。
アルゴリズムも似ているしよ。

52 :デフォルトの名無しさん:03/01/08 21:30
>んー。2ch圧縮アルゴスレは埋め立てられたか…。

このスレで、継続していきやしょう。

53 :IP記録実験:03/01/08 21:42
IP記録実験
http://qb.2ch.net/test/read.cgi/accuse/1042013605/

1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。

27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?

38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27
鋭いです。

73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。

54 :デフォルトの名無しさん:03/01/09 02:32
>>638
こらっ!しんのすけ。

55 :デフォルトの名無しさん:03/01/09 03:16
悪いこと書かないから関係ないよ

56 :デフォルトの名無しさん:03/01/09 18:42
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 138720人 発行日:2003/1/9

年末年始ボケがそろそろ収まり始めた今日このごろのひろゆきです。

そんなわけで、年末に予告したIP記録ですが実験を開始しています。

「2ちゃんねる20030107」
こんな感じで各掲示板の最下部に日付が入ってるんですが、
20030107以降になってるところはログ記録実験中ですー。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────

57 :デフォルトの名無しさん:03/01/09 18:47
結論は秘密ですか?

58 :デフォルトの名無しさん:03/01/09 19:54
データを推理で復元できないのだろうか?

59 :デフォルトの名無しさん:03/01/09 21:00
>>58
予測復号って奴ですかい(^^;
「脳内補完」とか「錯覚」という人間自身の
予測を利用したのがJPEGやらMP3なんだけどね…。

ある程度の予測と補完は、選択したモデル化次第で
可逆圧縮でも可能だろうけれど、でもEXEファイルを
圧縮/復号した結果、正常実行可能かどうかの保証は難しいだろうな。

単に「次にくるある文字の確率が“おそらく”高いのならば、
その文字の符号語長を短縮するよう計らう」っていう観点でなら、
適応的ハフマン/算術圧縮の類でいくつかが実現されている。



60 :デフォルトの名無しさん:03/01/09 21:04
>>58
マルコフモデルだろ?
http://member.nifty.ne.jp/DO/algorithm/ppm.htm

61 :デフォルトの名無しさん:03/01/09 21:09
<余談>
日本語の「予測」は、英語だと prediction で、「予測、予想、予言」となるのがちょっと面白い?
</余談>

予測に失敗した場合のダメージを考慮しないといけないからつらいね。
推理して(すなわち補間して?)穴埋めしても、それが間違った方向なら、
無歪みでは、
 符号化時の予測失敗は、そのままビット長の増大
 復号時の失敗は、回復不可能な無限大のダメージ
有歪みでも、
 ビット長の増大・ノイズの増加、のどちらかが起こりうる。

62 :デフォルトの名無しさん:03/01/09 22:34
>日本語の「予測」は、英語だと prediction で、「予測、予想、予言」となる
ならねえよ
語源がちげえのにマップするわけねーだろ

63 :デフォルトの名無しさん:03/01/09 23:02
2ch板一覧
 http://www.skipup.com/~niwatori/keijiban.htm

>728 ( ´∀`)σ)Д`) プニ

64 :デフォルトの名無しさん:03/01/09 23:29
>>62
すまないが、ならない理由を教えてもらえないか?
データ圧縮で次の記号を予測することを prediction ということには間違いないのだが。

65 :デフォルトの名無しさん:03/01/10 00:55
571の言いたい事が分からないので、もっと詳しく       

66 :デフォルトの名無しさん:03/01/10 01:02
65は話題の人工無能かとおもてしまた。
レス番号が頓珍漢だが、突っ込みが的確だw

67 :デフォルトの名無しさん:03/01/10 09:36
>>65
むしろ懐かしさすら覚えるよ。

68 :デフォルトの名無しさん:03/01/10 09:56
>>65
むしろ懐かしさすら覚えるよ。

69 :デフォルトの名無しさん:03/01/10 10:14
>>68
ちがうっつーの。あんな出鱈目坊と一緒にしないでくれ。

70 :デフォルトの名無しさん:03/01/10 10:48
(★∀`)y─┛~~~~~2ちゃんなくなったらマスコミに対抗する手段がなくなる

71 :デフォルトの名無しさん:03/01/10 11:30
>>91-92
読んでみた。
前半は難解だったけど最後まで読んだら
ネットについての理解が格段に深まった。
ありがとう。

他の人も、煽ってばかりじゃなくて
一度読んでみるといいと思う。

72 :デフォルトの名無しさん:03/01/10 12:50
まあ、永遠に続くものでもないしな

73 :デフォルトの名無しさん:03/01/10 15:15

ログイン出来ないんですか…?

74 :デフォルトの名無しさん:03/01/10 16:40

黒星でいいか?

75 :デフォルトの名無しさん:03/01/10 23:01
警察、裁判所の世話になる書き込みをしなきゃいいだけの話だろ
IP記録する事で基地外の書き込みが減るだろうから、なにも困る事はないだろう?

76 :デフォルトの名無しさん:03/01/10 23:07
全鯖に入ったぞ。
http://qb.2ch.net/test/read.cgi/accuse/1042131034/312
2ちゃん史にまた1ページ加えられた。

77 :デフォルトの名無しさん:03/01/11 00:24
匿名じゃなくなったら2ちゃんねるはただの掲示板じゃないの?
魅力がなくなる ->> 閉鎖
ってことにならなければよいが

78 :デフォルトの名無しさん:03/01/11 00:34
勉強。

79 :デフォルトの名無しさん:03/01/11 02:06
>>77
Windows に魅力が無くても MS は閉鎖しない。

80 :デフォルトの名無しさん:03/01/11 09:57
匿名性のメリットはそういう点でなく、
「双方向目安箱」だと思うよ。

小泉が一般人の振りして2chで議論
これも匿名だから可能だろ?

実際に小泉がやったか知らないが…

81 :デフォルトの名無しさん:03/01/11 10:29
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 139038人 発行日:2003/1/10

なにやら、連日メルマガだしてるひろゆきです。

そんなわけで、ログ記録実験ですが、いちいちサーバ指定するのが面倒なので、
全部のサーバに入れてみました。

重くなって落ちたりしてもご愛嬌ってことで。。。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────

82 :デフォルトの名無しさん:03/01/11 11:22
売られても文句は言えない。
●を買った人間は金払って2chを利用してるワケだが、
●買った人間のみID出なくなるとか、サービスありゃいいのにな。

83 :デフォルトの名無しさん:03/01/11 11:53
夜勤さんはシアトル産の鯖を北海道で代理販売してるんじゃなかったっけ。

84 :デフォルトの名無しさん:03/01/11 12:55
これで同人板の誹謗中傷さんも消えるでしょう
同人板の連中に潰されていった作家、サイト、関係者もさぞ浮かばれることでしょう。

85 :デフォルトの名無しさん:03/01/11 13:26
アタックって2ch鯖にか?意味不明

86 :デフォルトの名無しさん:03/01/11 14:59
>>85
今までは仮にハックしても誰にもバレなかったの。
証拠になるログを誤魔化す必要さえなかったし。


87 :デフォルトの名無しさん:03/01/11 16:12
IPって何ですか?

88 :デフォルトの名無しさん:03/01/11 16:18
漏らすバカが出るだろうというのが一番の問題なんだよ

89 :デフォルトの名無しさん:03/01/12 00:19
(・∀・)チューボーですよ!

90 :デフォルトの名無しさん:03/01/12 00:30
ねぇ、6億超えちゃったんだし
どこで見えるのか教えてちょーだいよ。

91 :デフォルトの名無しさん:03/01/12 10:43
>今後期待できるのは、裁判例をイパーイつくってくれることくらい

そうなるでしょ。おそらくは。今後の掲示板・コミュニティ運営は
2ちゃんの失敗を参考にしてなされるでしょう。
2ちゃん自体はゆっくりと氏んで逝く。管理者が西村から山本に
変わったからと言ってどうなるものでもない。
隊長が後処理の総責任者になるんじゃない?ひろゆきはそのうち
刑事罰喰らってもおかしくないし。

92 :デフォルトの名無しさん:03/01/12 21:16
IPアドレスは番号みたいなもの。
ホストは、住所みたいなもの。
IPは郵便番号みたいなもの。
両方ばれるとヤバイネ!!

93 :デフォルトの名無しさん:03/01/12 21:18
つうか(^_^;)本体のレス見てないのかな?w

542 名前:マァヴ ◆jxAYUMI09s 投稿日:03/01/12 02:22 ID:kxpim/a2
いやさ(^_^;)ここでプチ法廷ごっこやっても
しょせん机上の空論だよ?
実際争点となったっていうか、法理的に詰まった点とかけはなれてるもん・・・。



94 :デフォルトの名無しさん:03/01/12 21:31
ぉぃぉぃ(^_^;)

95 :山崎渉:03/01/13 18:56
(^^)

96 :デフォルトの名無しさん:03/01/13 23:18
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
---【関係者は読んでおけ。話はそれからだ。】---
http://teri.2ch.net/accuse/kako/988/988866718.html
706 名前: 19@悲惨認定らしい 投稿日: 2001/05/07(月) 18:59 ID:???
2ch擁護論者も不用論者も、時間かけてでもこのスレ読むといいぞ。
ネット倫理の理解が格段に深まる。
★★日本生命事案に見る、掲示板の削除義務★★
http://cocoa.2ch.net/hoken/kako/987/987605232.html
2ch以外も含めて、俺が見たなかで最高のスレだ。
-----
これをまとめたらしいのが
http://www.geocities.co.jp/Technopolis-Mars/6820/hoken/

裁判に勝った動物病院には、裁判の前に俺が電話で
↑のURLを教えてあげておいたのさ。
判決も↑の内容にある程度沿った内容だったしな。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

97 :山崎渉:03/01/15 18:10
(^^)

98 :デフォルトの名無しさん:03/01/19 17:14
プッ

99 :山崎渉:03/01/23 21:58
(^^)

100 :100 get:03/01/24 11:15
>>50
過去ログ倉庫に入ってますよ
【2ch】圧縮アルゴリズム【オリジナル】
http://pc3.2ch.net/tech/kako/1028/10285/1028570486.html


101 :デフォルトの名無しさん:03/02/06 01:45
>>100
パート2って無いの?【2ch】圧縮アルゴリズム【オリジナル】
の。

102 :デフォルトの名無しさん:03/02/06 23:11
>>101
このスレも、タイトルだけ見たら同じに見えるから。

103 :デフォルトの名無しさん:03/02/10 13:58
【2ch】圧縮アルゴリズム【オリジナル】の続きってことで再利用。

BPEに関してなのですが、
最高頻度ペアを1度も出現していない記号に置き換えるのではなく、
最高頻度ペアと最低頻度記号を交換するタイプって既にあるでしょうか?

ababcab ⇒ ccabc (ab⇔c)

となります。

104 :デフォルトの名無しさん:03/02/10 14:02
あんたがったタフマン

105 :103:03/02/10 14:08
尚、>>103を単純に実装すると復元できないパターンが出現します。

cabaaaac ⇒ caaabbc (aa⇔b)

などがその例ですが、回避は低コストです。

また、最低頻度記号すべてを最高頻度ペアに変換する必要はありません。
変換する記号の1つ前の記号の偏りを利用して最小限に押さえます。

106 :デフォルトの名無しさん:03/02/10 23:48
age

107 :デフォルトの名無しさん:03/02/23 00:20
>>105
スレ活性化の為にも
回避策おせーて!

108 :デフォルトの名無しさん:03/02/23 18:21
BPE自体オリジナリティ感じないから、それを
アレンジしても、いまいち感はぬぐえないな

BPEは、さっきググって知ったばかりだけど

109 :デフォルトの名無しさん:03/02/24 00:13
>>108
最頻digram圧縮 と呼ばれることもあるから、それで調べてみ。
とはいっても手法としてはいまいちって感じだけど。
その系統のほとんどの論文は、理論的な方面での興味が中心なので。

110 :デフォルトの名無しさん:03/03/14 17:38
あげますた

111 :デフォルトの名無しさん:03/03/14 17:40


112 :デフォルトの名無しさん:03/03/14 21:09
>>109
実用上でもLZと遜色無い程度の圧縮率は得られそうだけど、どうよ?

113 :デフォルトの名無しさん:03/03/14 22:47
>>112
LZ法などという、すでに過去のものとの比較はやめようよ。

114 :デフォルトの名無しさん:03/03/15 07:44
圧縮前のデータの正規化か
プログラムのコードって割と正規化しやすいんじゃないかな
.exeの圧縮って圧縮率稼げそうな漢字

115 :デフォルトの名無しさん:03/03/15 21:35
>>114
LZEXE とか DIET とか、MS-DOSの時代にあったね。
それに rk も exe に特化した圧縮あるし。
Java のバイナリコード専用の圧縮ソフトもあるし。
論文も結構あるしね。

・・・つまり、参入の余地は少ないってこった・・・

116 :デフォルトの名無しさん:03/03/16 07:53
>>115
普及率から考えて、7-Zip、WinRARが最大のライバルかと

117 :114:03/03/16 12:13
>>115
(´・ω・`)

118 :デフォルトの名無しさん:03/03/16 14:13
データ圧縮はすでに90年頃から、すでに終わった分野だと言われているよね。
94年にブロックソート法が考案されたおかげで、多少息を吹き返したが。
今、研究や論文でも純粋なデータ圧縮はごくまれで、しかもデータ圧縮といっても、
マイナーな手法の改良とか、理論的・実践的に偏りすぎているものとか。
いまだに最適なものが見つかっていない通信路符号化と違って、
用意に最適な符号を構成できる情報源符号化の未来は、あまり広くない。
もしこれから誰かがすばらしい手法を発見したとしても、
ブロックソート同様、数年のうちに何千という論文が巻き起こり、結局、それで終わり。

むぅ。

119 :デフォルトの名無しさん:03/03/16 14:37
>>118
でも、実装に関してはまだまだ改良の余地があるんじゃないかな?
特にPPMやLZは余地が大きそう。

120 :デフォルトの名無しさん:03/03/16 18:05
(゚∀゚)でもなんていうか
データの種類でやっぱ最適解って違うっていうか
画像ファイルと音楽ファイルとじゃ適した圧縮形式違うというか
そういう感じで今後もほそぼそと進歩していくんじゃないかと
思ったりするわけで
話し違うけど、MIDIなんかある意味圧縮だと考えてもいいわけで
そいうアプローチもアリかなぁと思ったり思わなかったり

121 :デフォルトの名無しさん:03/03/16 19:19
なんでみんなsageるの?
もっと昔から終った終ったと言われながら発展しているのがこの分野の特徴ではないかな >>118
今後もBSみたいなのが散発的に発明され発展していくものと思われ

122 :デフォルトの名無しさん:03/03/16 23:37
基本的に sage 進行の板だから。

>>120
表現形式と圧縮とは違うと思うけど。
その立場だと URL は圧縮論やアカシックレコード論と同じになる。

123 :デフォルトの名無しさん:03/03/17 01:03
sage進行という弱い考えに反逆する!

>>122
でも、そういうアプローチの非可逆圧縮ってあってもいいと思わない?

124 :デフォルトの名無しさん:03/03/17 01:11
別に age sage は個人の好きでいいと思うよ。

だからそれを認めると、文書要約も検索エンジンの結果も圧縮ということになる。

125 :デフォルトの名無しさん:03/03/17 01:42
>>124
そうですね。
圧縮技術を検索技術に活かす、あるいは統合できても、
圧縮そのものの研究・開発としては対象ではないという。

126 :デフォルトの名無しさん:03/03/17 01:52
解凍結果が「似たようなもんでいい」っていうレベルの
圧縮技術だったら なんか適当な計算式で近似してみる
っていうのもありかなー、とかいう話だね
FM音源の音色データなんかも圧縮と言えなくも無いかもしれないかも

127 :デフォルトの名無しさん:03/03/23 03:08
BPEは圧縮が遅いのと圧縮率がたいしたことない(それでもAveで50%以下にはなる)のが
問題かな。展開は早いんで、展開時間を重視する用途には向いていると思われ。
圧縮時間を犠牲にできるならBPE + α(LZHみたいに)といった、2通りのアルゴリズムを
併用すると効果があるかもしれない。ちなみに個人的に面白いと思ったのは画像形式の
.MAG(古いな)のフラグ圧縮。「圧縮できないという情報」を圧縮するというのは面白いと
思った。

128 :デフォルトの名無しさん:03/03/23 03:13
それで思い出したけど、PIC形式(懐かしいな)って
アルゴリズムを解説してるサイトある?

129 :デフォルトの名無しさん:03/03/23 03:24
>>127
LZSS+Huffman の LZH, gzip は圧縮できないフラグを圧縮しているといえる?

圧縮時間が大きく展開が速いのは LZ77 系や文法圧縮法の特徴で、
LZB (だったような?)法は、かなりいけてます。

130 :デフォルトの名無しさん:03/03/23 04:10
>>129
単純BPEの展開はLZ系と比べても爆速です。だって単なるスタック構造で、配列を見ながら
最終バイトペアまで分解して(配列サーチは高速)あとはポップしていくだけなんで。
BPEのいいところは、LZ系の圧縮率に近く、なおかつ展開速度が速く、消費メモリも少ないと
いうこと。用途によってはLZよりいいはず(たとえばコンシューマゲーム機でバックグラウンド
でCD読みつつ展開して使うような場合)。

131 :デフォルトの名無しさん:03/03/23 04:18
>>130
ただのLZのほうが遥かに速いです。オフセットからのmemcpyだけで、余分な「消費メモリも0です。

132 :デフォルトの名無しさん:03/03/23 06:03
>余分な「消費メモリも0です。
そーかな?

133 :デフォルトの名無しさん:03/03/23 06:55
>>131
いや、ビットストリームを扱わないのがBPEの最大の利点なわけで。

134 :デフォルトの名無しさん:03/03/23 06:57
ちょっと間違い。ビットストリームじゃなくてビットアクセス。全部バイトで
処理できるから軽いです>BPE

135 :デフォルトの名無しさん:03/03/23 11:54
レスを読んでないのだが、>>1の言ってることは、

「データを1バイトおきに読み飛ばして圧縮したぞ。
あとは復号する方法を考えてくれ。」

って言ってるようなもんだよね。

136 :デフォルトの名無しさん:03/03/23 12:02
↓↓ アダルトDVDが今ならなんと!一枚900円! ↓↓
    http://www.net-de-dvd.com/
↓↓ 特売品は、なんと一枚600円!! ↓↓
    http://www.net-de-dvd.com/
↓↓ 数に限りあり!早いもの勝ち。急げ ↓ ↓
    http://www.net-de-dvd.com/

137 :デフォルトの名無しさん:03/03/23 13:22
>>134
全部バイトアクセスのLZもあるのですが。

138 :デフォルトの名無しさん:03/03/23 21:43
BPEとLZ77の最大の違いは、

・圧縮したまま検索する手法が有効か(BPE)、無効か(LZ77)

ということだ!

139 :デフォルトの名無しさん:03/03/24 07:55
>>138
BPEはLZ78系では?

140 :デフォルトの名無しさん:03/03/24 17:57
LZ系は動的辞書なのに対し、BPEの書換えペアは静的辞書とみなせる

141 :デフォルトの名無しさん:03/03/25 00:58
「LZ系」でくくると語弊ありそうなんだが…。
ほんとに“動的辞書”を使ってるのはLZ78系列ですぜ。
情報源をモデル化する過程で動的に辞書を構築する、という意味。
LZ77系列のは“スライド辞書”あるいは“移動窓”言いますが、
これはどっちかって言うと静的な(単なるFIFOバッファな)辞書なん。
BPEの“圧縮したまま検索する手法が有効”ってのもちょっと微妙。
これはBPE法が“純然たるユニバーサル符号化”ではなくて、
情報源を少量のブロックに分割しながら出ないと圧縮できないことを逆手にとって、
ブロック単位で途中からや後方からでも、任意位置の展開ができることを利用する。
余談だけどBPEと同種の考え方をユニバーサル符号化したアルゴリズムについては
→ ttp://localhost/techniqueroom/dca-6-5.html (まだ未完成なコンテンツらしいが)

142 :デフォルトの名無しさん:03/03/25 05:50
localhostを出されてもかなり困るわけですが

143 :デフォルトの名無しさん:03/03/25 06:12
>>141
とっとと完成させて公開してね。

144 :デフォルトの名無しさん:03/03/25 06:19
○○○○ こんな電波はありませんか? ○○○○

荒らしなどのコピペで、厨房、工房、消防、
このような人たちをコピペで煽りを行えるコピペは無いでしょうか。
出来れば制限時間内に5レスくらい返ってくる、みたいな含蓄のあるもの。
出来ればレベルの高いものをお願いします。
荒らしと書きましたが、形式は全く問わないです。
著作権、版権も問わないです。

お願いします。

145 :デフォルトの名無しさん:03/03/25 06:22
>>128
初期の頃の電脳倶楽部に載ってた様な。


146 :デフォルトの名無しさん:03/03/25 06:51
>>145
あとOh!Xの1990年2月号に詳しくのっている。
ほかにもCで書かれたpicローダが巷に結構あるから参考になるかな。

147 :デフォルトの名無しさん:03/03/25 08:47
>>141
ttp://multix.jp/techniqueroom/dca-6-5.html
ここですね(さらし目的じゃないです)

148 :デフォルトの名無しさん:03/03/25 18:44
>>147
ユニバーサル圧縮法って書いているけど、どこにも証明がないような。
この人が考えたオリジナルの手法だよね?
多分容易に証明できるのだろうけど、それなしにユニバーサルを名乗っちゃだめだろ。

149 :デフォルトの名無しさん:03/03/26 00:56
commpression
の綴りが間違ってるからじゃないのか。

150 :デフォルトの名無しさん:03/03/26 01:11
PPMを「非主流のマニア向け」などと評しているところが、いやんな感じ。
PPMは今や、XML, DNA, テキストマイニング, 検索, データベース,
などの圧縮での応用で、トップクラスの利用頻度を誇っているわけでして。

あと、エントロピーという語を乱用しているような気がして、さらにいやん。

151 :デフォルトの名無しさん:03/03/26 05:50
>>141
どうでもいいですが、ジサクジエン失敗ですか?

152 :デフォルトの名無しさん:03/03/26 18:20
圧縮後でもパターンを作れれれば圧縮できますよね?
無秩序状態を崩すための暗号化とか無いんでしょうか。

153 :デフォルトの名無しさん:03/03/26 18:26
符号に偏りが生じるようでは暗号化としてダメダメです。

154 :デフォルトの名無しさん:03/03/26 18:43
まあそうなんですが、例えばコードを+1,+2,+3...+255と
順番に足していって運任せで崩すようなそんな感じの物です。

155 :デフォルトの名無しさん:03/03/27 00:26
>圧縮後でもパターンを作れれれば圧縮できますよね?

つかすでに、世の中の圧縮研究者は、
そのパターンが存在すれば存在しないで済む、あるいはさせない方法を考えている。
たとえばLZ77法のポインタ表現は、かなりの無駄が生じるので、
それをエントロピー符号化するだけでも、さらに縮まる。

暗号の方は、言っていることがいまいちわからん。

156 :デフォルトの名無しさん:03/03/27 02:06
>>154
ランダムな数列でも適当に加工することで、圧縮できるようにするということだと思いますが、
それがどのパターンであるかを符号化した分で、圧縮できる分は帳消しになるか肥大化します。
つまり無意味です。

157 :デフォルトの名無しさん:03/03/27 02:25
>それがどのパターンであるかを符号化した分で
これを記録しないってのはどうよ?
複合化されたバイト列が大体正しい事を証明する(256bitのハッシュでも)情報を記録しておいて、
符号を解読していくの。

158 :デフォルトの名無しさん:03/03/27 02:35
>>157
その場合、圧縮できる分が256bitより少ない方が圧倒的に多いのです。
適当にモデルを作って、パターンやハッシュが何通りあるか考えればわかると思います。

159 :デフォルトの名無しさん:03/03/27 02:46
いや、だからパターンは記録しないんだよ。
手がかりのないところから暗号を解読するような感じ
勿論、復元できないファイルも出てくるだろうが、
それは気にしないことにする。

GUIDでも絶対に重複しないって言われてるんだから、
256bitのハッシュが有れば復元のヒントになるんじゃないかと。

160 :デフォルトの名無しさん:03/03/27 03:01
>>159
何だか直感だけの気がするので、どうするとそんなことができるのか、もう少し根拠が欲しい所ですね。
また、復元できないでもいいというのはメリットがよくわかりません。

161 :デフォルトの名無しさん:03/03/27 03:02
>>159
あと、私が158で書いているのはパターンではなく、256bitのハッシュ値を記録することです。
その分すらも圧縮できないということです。

162 :デフォルトの名無しさん:03/03/27 03:23
最強の圧縮

MD5ハッシュ→(p2pワールド)→元ファイル

全てのファイルを16byteに圧縮できます。

163 :デフォルトの名無しさん:03/03/27 03:28
>>162
アカシックレコードとそのインデックスみたいなものですね。

164 :デフォルトの名無しさん:03/03/27 07:04
だからそれは(ry

165 :デフォルトの名無しさん:03/03/27 09:42
>>162
Winnyの同一ハッシュな偽者が出回って問題になったことがあるのだが。

166 :デフォルトの名無しさん:03/03/27 11:16
>>165
それはWinnyのキャッシュがMD5ハッシュになる以前の話なわけだが
突っ込むならそれくらいちゃんと調べてから書いてくれよ

167 :デフォルトの名無しさん:03/03/27 11:17
つーかその事件が起きたからこそハッシュをMD5に変更したわけで

168 :デフォルトの名無しさん:03/03/27 11:18
>>164
実際に運用可能な点が今までの机上の空論的
アカシックレコード圧縮と違う点だな

169 :165:03/03/27 11:32
>>166
要は1/65536なんかあてにならないといいたいのだが。
(ビットを増やしてもハッシュ値が同一になることがありえることに変わりはないし)

170 :デフォルトの名無しさん:03/03/27 12:44
>>169
> 1/65536
小学校から算数やり直せ


171 :デフォルトの名無しさん:03/03/27 12:47
>>165は意図的に同一ハッシュを作れるという話でぜんぜん
適切な例じゃないし。
MD5があてにならないなら現在の暗号化システムは全滅なわけだが

172 :デフォルトの名無しさん:03/03/27 21:01
MD5で圧縮というのは、典型系列を圧縮するという問題そのままじゃないか?
MD5に長さ情報が入っているかどうかしらないが、
入っているならば一部手を加えて、ほとんどそのままユニバーサル符号だし、
もし入っていないならばさらに log n ビット追加するだけでユニバーサル符号になる。

173 :デフォルトの名無しさん:03/03/28 01:50
↓別のネタおながいします。

174 :デフォルトの名無しさん:03/03/28 02:17
・まずビットで見たときの0の個数を記録する
・次にそのデータが何番目に来るのかを記録する

たとえば 010 を符号化する場合、0が2個という情報をまず符号化する。
次に、0が2個であるすべての集合から010が辞書順で何番目に来るか、
つまり、001, 010, 100 の2番目なので2を符号化する。

175 :デフォルトの名無しさん:03/03/28 09:22
それはインデクシングじゃないかい。

176 :デフォルトの名無しさん:03/03/28 18:19
ファイルを0バイトに圧縮するプログラムを作りました。
http://www.geocities.co.jp/Playtown-Denei/1184/satoimo/

177 :デフォルトの名無しさん:03/03/29 00:06
上のプログラム検証する勇者はいないのか?

178 :デフォルトの名無しさん:03/03/29 00:15
ふとん圧縮機のアルゴリズム誰か解明すれ!

179 :デフォルトの名無しさん:03/03/29 00:33
>>178
ランレングス方式みたいものを想像してください。
布団はその性質上空気を多く含んでいるので
布団の成分を 1 、空気を 0 とすると、
10000000000000000010000000000001000001000000001000000000000000000001
このようにあらわせます。
そこで、ゼロの数のみ表記すると
11 0C 05 08 14
となります。
実際にはゼロの数(空気の割合)というのはもっと膨大なので
圧縮率は上に挙げた例よりも大きくなります。

180 :デフォルトの名無しさん:03/03/29 01:44
>>176
まぁ確かに圧縮したら0バイトになるし可逆圧縮だけど、
間違いなくこれを考えた>>176はホゲ。

181 :デフォルトの名無しさん:03/03/29 02:20
>>180
これってNTFSのストリーム?

182 :デフォルトの名無しさん:03/03/29 12:36
これって容量制限のある鯖にageた時、どういう扱いになるんかな?

183 :デフォルトの名無しさん:03/03/29 14:32
ロジックパズルみたいに出来ないかなー

184 :デフォルトの名無しさん:03/03/29 14:35
>>176
賢いやつだな!久々に感心したよ!

185 :デフォルトの名無しさん:03/03/29 16:59
>>182
試してみたよ。容量にカウントされなかったでつ。
おいこれって意外と使えるんじゃないか!

186 :デフォルトの名無しさん:03/03/29 17:04
>>185
調子に乗って使いつづけていると、あとでしわ寄せが来る罠。

187 :デフォルトの名無しさん:03/03/29 17:44
アングラ系で流行るかも

188 :デフォルトの名無しさん:03/03/29 21:35
>176
面白そうだったのでやってみた
FAT16(Win98SE)でも問題無し
圧縮って言うか隠蔽向き

あぁ,本当にこれやるヤシいるんだな...

189 :里芋:03/03/29 22:50
自分のマシンで実行する勇者がいるとはさすが2chですな…

>>188
FAT16 は1ディレクトリに最大 65534 ファイルまでしか作れないと思うんで、
あまりデカいファイルの0バイト化はできないと思われ。

190 :デフォルトの名無しさん:03/03/30 00:52
容量制限されてる無料鯖を鯖が許す限り使えるの?

191 :デフォルトの名無しさん:03/03/30 01:15
>>190
サーバがNTFSならな

192 :里芋:03/03/30 02:06
>>191
今日日の公開されてる鯖はLinuxとかなんで、
ファイルシステムは ext2 とかだから問題ないでしょう。

193 :デフォルトの名無しさん:03/03/30 02:12
>>189
でかいファイルの時はさらに深くディレクトリ掘ればできるだろ。

194 :デフォルトの名無しさん:03/03/31 01:42
age

195 :デフォルトの名無しさん:03/03/31 01:52
見た目サイズが0になるだけなの?

196 :デフォルトの名無しさん:03/03/31 02:06
>>176
今のうちに特許取っとけ


197 :デフォルトの名無しさん:03/03/31 02:24
>>195
ファイルのデータがあって、それを強引にサイズ0になるようにOSをだましてるとか、そういうのはないと思うよ。
漏れは怖くてためしてないが。
実際にファイルサイズが0のはず。

198 :デフォルトの名無しさん:03/03/31 03:03
5MB->0バイトにしたファイル(フォルダ)をzipしたら20MBになりますた

199 :デフォルトの名無しさん:03/03/31 03:46
>>198
それは言わない約束です。( ̄ー ̄)ニヤリ

200 :デフォルトの名無しさん:03/03/31 21:11
いやーワラタw

201 :デフォルトの名無しさん:03/03/31 21:14
>>176は神!

202 :デフォルトの名無しさん:03/03/31 21:22
前どっかで>>176の逆みたいなやつあったな。
フォルダの中にそのフォルダがあって(再帰みたく)、
容量がテラとか普通にいってた。


203 :デフォルトの名無しさん:03/04/01 00:39
ディレクトリエントリ自体はどんどん増えるので、
unixでもquotaにはひっかかるんじゃないかな?
quotaってディレクトリの大きさって数えないっけか

204 :里芋:03/04/01 02:36
>>193
できるけどFATのためにそれ作るのめんどくさい。

>>198
zipとかlzhはフルパスを無圧縮で持ってるから増えて当然。

>>203
unix の場合は inode の数までならファイル作れると思う。
でも、アタックと間違えられるかも…

205 :デフォルトの名無しさん:03/04/02 11:39
遅レスだが。
>>24
最小単位だバイトだと信じているアフォ。

206 :デフォルトの名無しさん:03/04/02 11:49
>>205
別に最小単位がバイトだと言ってるわけでもないし
バイトじゃなくてワードでも同じじゃないの?
アフォかどうかはおいといて。

207 :デフォルトの名無しさん:03/04/02 13:32
>>176
これ冗談じゃなくてほんとに実用に使えるよ。パスワードとか大事な暗証番号をこれで変換してどっか深いフォルダに入れれば、どんな検索かけてもまず発見されないと思う。
今のうちに特許取っとこうよ!

208 :デフォルトの名無しさん:03/04/02 13:38
少なくともUNISYSのGIFアルゴリズムよりは格段に使える。

209 :スレ違い:03/04/02 14:05
圧縮じゃなくて偽装・隠蔽じゃないの?

210 :デフォルトの名無しさん:03/04/05 22:09
http://www.houko.com/00/01/S34/121.HTM
【特許法】
(特許の要件)第29条 産業上利用することができる発明をした者は、
次に掲げる発明を除き、その発明について特許を受けることができる。

1.特許出願前に日本国内又は外国において公然知られた発明
2.特許出願前に日本国内又は外国において公然実施をされた発明
3.特許出願前に日本国内又は外国において、頒布された刊行物に記載された発明
又は電気通信回線を通じて公衆に利用可能となつた発明特許出願前にその発明の属する技術の分野における通常の知識を有する者が
前項各号に掲げる発明に基いて容易に発明をすることができたときは、
その発明については、同項の規定にかかわらず、特許を受けることができない。 

211 :デフォルトの名無しさん:03/04/05 22:33
大丈夫だろ
コロンブスの卵も特許取られてるしな

212 :デフォルトの名無しさん:03/04/06 21:01
http://dev.fam.cx/~minachun/の人とGCAの人喧嘩した噂たってるんだけど本当かよ。
winnyでログながれてるんですが。

213 :デフォルトの名無しさん:03/04/06 21:02
age

214 :SYN ◆8smMJ0UaoA :03/04/07 01:08
>>212
winnyのログってどれでしょうか?
昔同じ大学で同じクラブにいたので、みんなで遊んでいることもあれば、
意見が合わず喧嘩したりとかもいろいろありましたが、第三者が騒ぐようなことではないです。


215 :勹"ノヽノヽノヽノヽノヽ :03/04/08 17:53
GCAの中の人も自分のページでちゃんと説明しているでしょ
早くDGCA正式版にならんかなー

216 :デフォルトの名無しさん:03/04/08 23:13
>>214
そのものじゃないんすけど、

[BBS_ゲーム制作技術] 自作ゲームの開発状況を晒すスレ
ハッシュ 5743254f7e578f6c6972a93028c9632c
このスレの 113 の人がログ持ってるみたいです。

217 :山崎渉:03/04/17 15:38
(^^)

218 :山崎渉:03/04/20 04:24
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

219 :デフォルトの名無しさん:03/04/23 21:16
BlockSortingをするにはかなりメモリを使うと思いますが、大きいファイルを圧縮するときは、
ファイルを分割してソートしているんでしょうか?それとも、何かうまい回避法があるのでしょうか?

220 :デフォルトの名無しさん:03/04/24 01:17
>>219
OSを信じてガンガンやる

221 :デフォルトの名無しさん:03/04/24 08:19
>>219
BlockSortingに必要なメモリはだいたい
・巡回した文字列を作るのにブロックサイズ×2
・並び変わった状態を保持するためにブロックサイズ×4(sizeof(long))
で、たいていは1〜15MBくらいのブロックに分割して処理しているはず。
なお、BlockSortingはブロックサイズが大きいほど圧縮率が高いとは限らない。

222 :219:03/04/24 15:00
>>221
> で、たいていは1〜15MBくらいのブロックに分割して処理しているはず。
なるほど、やはり分割するんですね。

> なお、BlockSortingはブロックサイズが大きいほど圧縮率が高いとは限らない。
単純な素人考えで、ブロックサイズが大きいほうが良いと思ってました。
必ずしもそうではないんですね。
ご丁寧なレスのおかげで、勉強になりました。ありがとうございました。

223 :デフォルトの名無しさん:03/04/25 18:54
comp.compression で凄い人が「凄い圧縮法」を開発したといって騒いでます…

224 :デフォルトの名無しさん:03/04/26 14:13
http://member.nifty.ne.jp/yamazaki/doc/basic_compression.html
今、↑これや↓これを読んで、RangeCoderを理解しようと、やってるんですが
http://nikq.nothing.sh/junkbox/rangecoder.html

区間幅の初期値を0x80000000にするのは何でなんでしょうか?
どうして、0xFFFFFFFFとかのようにもっと大きい数値を使わないんですか?
どなたか教えてください。

225 :デフォルトの名無しさん:03/04/26 17:29
>>224
特に問題ないなら0xFFFFFFFFでいいはず。
現に少し前のCマガジンに載っていた奥村晴彦氏のRangeCoderでは
0xFFFFFFFFに初期化している。

あと、RangeCoderなら ttp://www.geocities.co.jp/SiliconValley-Oakland/1680/zsaru.html
なんかがソース付でわかりやすいかと。


226 :デフォルトの名無しさん:03/04/26 18:17
>>225
0xFFFFFFFFでも大丈夫なんですね。
教えてくださったURL先のページはRangeCoder以外の事についても載っていて参考になります。
色々と教えていただいて、ありがとうございました。

227 :デフォルトの名無しさん:03/05/12 18:25


228 :名無し@沢村:03/05/13 13:56
データを10個飛ばしにすれば1/10に圧縮できるよ。
データを100個飛ばしにすれば1/100に圧縮できる。
要は何個飛ばしにするかということだよ。

229 :デフォルトの名無しさん:03/05/13 19:16
>>228
落ちたデータはどうするんですか(w

230 :デフォルトの名無しさん:03/05/13 21:04
>>229
予測して補間

231 :デフォルトの名無しさん:03/05/13 23:56
ゴルァリズム

232 :デフォルトの名無しさん:03/05/14 01:57
>>230
有歪みならそれでもいいんだけれどね・・・
(つか、画像や音声の圧縮で使われる、標準的な方法だね)

無歪みにするなら、予測値とのエラーをとってGolomb符号を使うのがいいのかな。
アルファベット間の相関がない場合はほとんど意味がないから、
テキストの場合は、圧縮率を稼ぐために、何か前処理か、静的な辞書が必要だな。

233 :デフォルトの名無しさん:03/05/14 02:02
それよりも、compressia のすさまじいまでの圧縮性能が気になる。しかも速いし。
ttp://compression.ca/act-win.html
ttp://www.compressia.com/

# SBCよりもちょっと遅くてちょっと高圧縮だから、ブロックソート系だろうか?

234 :デフォルトの名無しさん:03/05/14 08:24
>>233
ブロックサイズを指定するというオプションからしてBlockSort系だと思われ。

235 :デフォルトの名無しさん:03/05/16 09:57
ベタなデータ列でもないのに、
圧縮したらとてつもなく小さいファイルサイズになるっていう
ファイルってありますか?

ベタなデータ列ってのは
例えば数字しかかかれていないテキストファイルや、
白一色のBMPファイルとか、そういう単調なファイルのことです。

だれか、意味のある複雑なファイルなのに、これこれの圧縮ソフトを
使うと異常なほどファイルサイズが縮まるというファイルを教えてください
なるべく圧縮ソフトは有名なものがいいです。

236 :デフォルトの名無しさん:03/05/16 10:01
例えばEXEファイルで、実行するとそこそこの機能もあるのに、
しかしある圧縮ソフトを使うと、
わずか20バイトに圧縮されてしまう。とか。

極端すぎるかなぁ。

237 :デフォルトの名無しさん:03/05/16 18:35
>>236
20バイトのプログラムで何ができるのかを考えると・・・その例は極端すぎ。
現在の一般的なデータ圧縮は平均 1/4 になるといわれています。
1/8 以下に小さくできるなら、場合によっては異常といえるかもしれません。

ACT などで見てもらえばわかるように、Canterbury コーパスの kennedy.xls は、
zip や LHA などでは 1/5 にもならないのに、
それ以降のある程度の圧縮ツールでも 1/20 くらいに小さくなってきています。

238 :236:03/05/17 08:24
>>237
ありがとう^^


239 :デフォルトの名無しさん:03/05/17 09:20
>>237
1/20 というのは 5%に圧縮されるの意味だよね?
http://compression.ca/act-canterbury.html
ここだと、zipやlhaは30%程度、最高のcompressiaで13%。

http://corpus.canterbury.ac.nz/details/cantrbry/Excl.html
ここにはbzip2-6が0.99とか書いてあるけど、これは単位がわからん
(cat が 8.00 になってるし、、)

240 :デフォルトの名無しさん:03/05/17 19:59
>>239
8.00 を基準にするのは bit per character (bpc) ですね。
1記号を何ビットで表現できるかです。
普通のデータなら1記号8ビットなので cat だと 8.00 bpc

241 :デフォルトの名無しさん:03/05/17 20:03
>>239
ACT は canterbury コーパス全部のファイルを圧縮した結果です。
圧縮できるのは、そのうちの kennedy.xls というファイルです。

242 :デフォルトの名無しさん:03/05/17 22:29
>>235
意味のなくてしかも見方によっては非常に単純な内容だけど
00 01 02 ... fe ff 00 01 ... というように 00〜ff が順に繰り返されるデータは
まともな圧縮ソフトであればどれでも、大変小さくなります。

243 :デフォルトの名無しさん:03/05/18 03:09
http://member.nifty.ne.jp/yamazaki/doc/basic_compression.html

最近この辺を読み始めた。

244 :デフォルトの名無しさん:03/05/18 04:13
>>243
データ圧縮ハンドブック、買って読むがよい。
旧とっぱん、現ビアソンエデュケーションだったか。

245 :デフォルトの名無しさん:03/05/26 19:07
DO++氏のWX法が公開されてまつ。
ttp://member.nifty.ne.jp/DO/

246 :山崎渉:03/05/28 13:00
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

247 :名無し@沢村:03/05/28 13:16
おまいらよ、すべてのデータは1ビットに圧縮できるよ。
おれはたとえ何兆ギガバイトのデータだろうと1ビットに圧縮できるアルゴリズムを開発したよ。
まあ企業秘密なんで、詳しくは教えられないがね…。
その名は「量子重ねあわせ圧縮アルゴリズム」というんだよ。
つまり1ビットの中に、何兆ギガものデータを量子的重ねあわせの状態で詰め込むんだよ。
この技法を使えば全宇宙の全データを1ビットの中に詰め込むことも可能だよ。
おまいらには、想像もつかない超高度な技法よ♪

248 :デフォルトの名無しさん:03/05/29 02:47
沢村って、なんでこんなにかわいそうなんでしょうか。
量子情報理論の参考書を2・3行見るだけで、自分が愚かなことを口にしたことがわかるのに。
他の書き込みもそうだけど。

249 :デフォルトの名無しさん:03/05/29 03:11
>>248

これ見ただけだろ。
ttp://www.zdnet.co.jp/news/0305/27/nj00_ryoushi.html

250 :デフォルトの名無しさん:03/05/29 22:09
>>248
沢村は、検索エンジン&ロボット&人工無能フィルターです。
適当なニュース記事を沢村言葉に加工して、2ch にこぴぺするだけです。

251 :デフォルトの名無しさん:03/05/29 23:29
沢村はhello worldをすばらしいソフトとかいっている時点で糞。
というかプログラミングできるの?

252 :デフォルトの名無しさん:03/05/29 23:47
>>251
あの程度しかできないんだろうな。
出来れば公開するようなタイプだろうし。

253 :デフォルトの名無しさん:03/05/30 00:13
LZWの米国特許が、この6月で切れますね。
LZWの日本特許は、来年の6月19日・・・

もうちっとのしんぼうですね。

254 :デフォルトの名無しさん:03/05/30 00:30
>>253
すでに関連特許が示されているので、期間延期な罠

255 :デフォルトの名無しさん:03/05/30 00:35
>>252
あの程度しかとはひどい言い草だな。
人工無能であれだけ出来ればかなり高性能といってもいいぞ。

256 :デフォルトの名無しさん:03/05/30 00:40
沢村のあれ以下のソフトってあるの?w

257 :デフォルトの名無しさん:03/05/30 01:08
>>254

なぬ?情報知ってたら、開示きぼー

258 :デフォルトの名無しさん:03/05/30 12:49
>>247
重ね合わせ状態を生成するプログラムが何兆ギガバイト罠

259 :デフォルトの名無しさん:03/05/30 18:05
そもそも、重ね合わせたものを「ビット」などと呼称しない罠。
せめて「量子ビット」と書けや。

260 :デフォルトの名無しさん:03/05/30 22:28
「シャノンの定理」で検索してもわかりやすく解説してるHPがみつからなくてこまってます
どこかないですか?

261 :500MHz鈴木:03/05/30 23:05
http://www.capricious.info/

262 :デフォルトの名無しさん:03/05/30 23:13
LZWばりばりパクってますがナニか?

263 :デフォルトの名無しさん:03/05/31 01:22
>>260
植松先生のリンクをいろいろ辿ってみたらいかがでしょう。
http://www.it.ss.titech.ac.jp/uematsu/uematsu-j.html
http://eprints.it.ss.titech.ac.jp/

264 :デフォルトの名無しさん:03/05/31 01:28
LZWの期限切れオフやろうぜ!!

265 :デフォルトの名無しさん:03/05/31 01:30
ところで、いまさらLZWごときが使用できて何がうれしいのでしょう?
GIF? compress?

266 :デフォルトの名無しさん:03/05/31 01:34
スライド辞書は展開速いから良く使うけど

267 :デフォルトの名無しさん:03/05/31 11:56
>>264
日本では2004年に切れるとか。
ttp://www.kmonos.net/wlog/

>>265
LZ78系のアルゴリズムを遠慮なく開発できるようになるのが大きいかと。
(他の特許に引っかかるかもしれんけど)

268 :デフォルトの名無しさん:03/05/31 22:18
>>267
いや、それも含めて >>265 は今更といっているのでは?
大学の研究発表に特許が及ばないから、LZW系列は1990年には出尽くしている。
今後、企業でLZWの商品化ができるとしても、すでにくそのやくにもたちゃーしねぇ。

269 :デフォルトの名無しさん:03/06/02 18:42
>>268 すでにくそのやくにもたちゃーしねぇ。

何で? もっといいアルゴリズムがあるから?
gzipにも問題ありとしてるF社なんかは喜びそーだが

270 :デフォルトの名無しさん:03/06/03 22:25
>>269
gzip は LZ77 + Shannon-Fano だから、LZW とは全然関係ないはず。
gzip が問題なのは、LZ77 に Hash を組み合わせる手法に関して。
詳しくは、奥村せんせーのページをみてね。

F社って富士通? べつに伏せる必要はないと思うが。
富士通は、国内外の有名圧縮研究者から、独自手法を買い取って、
特許の問題がない手法を実装している。これ、誰でも知っている有名な話。

271 :253:03/06/23 21:19
 話を振った本人なので、一応、結果報告を・・・

LZW圧縮に関する特許が6月20日に米国で失効しました。
同特許は、日本では、来年の6月19日あるいは20日の
いずれかに失効します。

以下、そのソース
http://www.upfrontezine.com/upf-344.htm

And the patent on LZW compression expires 20 June.
Owner Unisys says it has no plans to extend the patent.
LZW is used by several graphics formats, including
GIF and TIFF. CNET guesses this may cause the
never-particularly-popular freeware-alternative PNG
to fade away.

和訳:(間違ってたらごめん)
・・・LZW圧縮に関する特許が6月20日に失効する。
特許所有者のUnisys社はこの特許の延長計画を持たない。
LZW圧縮は、GIFやTIFFを含む、グラフィックフォーマットの
いくつかで利用されている。
CNETは、今まで特に人気を得られなかった、代替フリー
フォーマットのPNGが、これによって消え行く運命だと見ている。

272 :デフォルトの名無しさん:03/06/23 22:20
PNGは消えないと思うけど、MNG/JNGがね・・・腐ってるね・・・終わってるね

273 :デフォルトの名無しさん:03/06/23 22:48
>>272
仕様が固まるのが遅かった。
IEが対応しなかった。

これが全てだと思う。

274 :デフォルトの名無しさん:03/06/24 01:38
GIF フリー来たー

のであげてみたけど、どうよ? GIF 使ってる?

275 :デフォルトの名無しさん:03/06/24 01:40
特許ってサーバの所在国に及ぶんだっけ?
それとも管理者?コンテンツ製作者?

276 :デフォルトの名無しさん:03/06/24 02:10
>>271
http://internet.watch.impress.co.jp/www/article/2003/0612/unisys.htm
> なお、UNISYSは、LZWに関してこれ以外に2件特許出願中で近く成立するとも発表しており、
> 今後GIF技術が完全開放となるかどうかは、知的財産権の状況推移を見守る必要がありそうだ。

って書いてあるんだけど。どーなんだろね?

277 :デフォルトの名無しさん:03/06/24 03:51
>>276
前科×犯の凶悪犯が更正することはまれ。
アメリカが戦争を放棄することはありえない。
UNISYSがLZWを(ry

278 :デフォルトの名無しさん:03/06/24 05:36
まあ、なくなるまでしゃぶりつくすだろうね。
企業だし、利益もとめるのは悪くはないが・・・。

279 :デフォルトの名無しさん:03/07/19 12:23
圧縮じゃなくて偽装・隠蔽じゃないの?

280 :デフォルトの名無しさん:03/08/01 17:08
なんかおもしろいな

281 :山崎 渉:03/08/02 02:05
(^^)

282 :山崎 渉:03/08/15 16:10
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

63 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)