5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

Microsoftの全文検索ソフト(Indexing Service等)

1 :うっかりさん:02/10/24 00:34 ID:+IrVemkB
Microsoft のフルテキスト検索ソフトに関するスレッドです。

各種ファイルフォーマット用のフィルタ、クエリーに使用できる言語、
各ソフトの提供する API やスクリプト向け機能、
ASP による Web システムからの利用などの話題も含みます。

主な対象製品
・Windows 2000 以降の Indexing Service
・IIS Index Server
・SharePoint Portal Server
・SQL Server
・Site Server

2 :うっかりさん:02/10/24 00:34 ID:+IrVemkB

関連リンク
http://www.microsoft.com/japan/technet/treeview/default.asp?url=/japan/technet/prodtechnol/sharepoint/reskit/part1/co5spprk.asp

関連スレッド
全文検索ユーティリティ統一スレッド
http://pc.2ch.net/test/read.cgi/bsoft/1006680403/

参考リンク
日本語全文検索エンジンソフトウェアのリスト
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html

3 :名無し~3.EXE:02/10/24 00:34 ID:/wSGsMSA


4 :うっかりさん:02/10/24 00:35 ID:+IrVemkB
Indexing Service が OS 標準の機能として提供されているので、
金銭的な追加投資なしで使えるという点を重視して、
フリーで使える全文検索ソフトをいくつか挙げておきます。

Namazu http://www.namazu.org/
Snatcher http://www.arc.ritsumei.ac.jp/kachina/mikio/snatcher-ja.html
Glimpse http://webglimpse.org/

5 :うっかりさん:02/10/24 00:35 ID:+IrVemkB
SharePoint Portal Server のダウンロードページ
120日評価版もダウンロードできます。
http://www.microsoft.com/japan/sharepoint/downloads/

上記ページにリンクのある IFilter のページで、
さまざまな文書フォーマット用のフィルタがダウンロードできます。
http://www.microsoft.com/japan/sharepoint/downloads/IFilter.asp

6 :うっかりさん:02/10/24 00:35 ID:+IrVemkB
フリーで使える全文検索ソフトのうち
Namazu が最も普及しているようですので、
関連スレッドをまとめておきます。

【UNIX板】全文検索エンジンNamazu
http://pc.2ch.net/test/read.cgi/unix/1009715036/
【Linux板】namazuでサーバーを立てたい
http://pc.2ch.net/test/read.cgi/linux/989179375/
【WebProg板 現行スレ】Namazu全文検索システム
http://pc.2ch.net/test/read.cgi/php/992477868/
【WebProg板 旧スレ】Namazu全文検索システム
http://pc.2ch.net/test/read.cgi/perl/981352718/

7 :うっかりさん:02/10/24 00:35 ID:+IrVemkB
Indexing Service が対象としているのはローカルファイルシステムと
共有フォルダ(UNC形式 \\server\share でアクセスできるディレクトリ)
だけです。そのため Windows 以外の OS と連携しようとすると
Samba を使う必要がありますので、関連スレッドをまとめておきます。

【UNIX板 現行スレ】 Samba その2
http://pc.2ch.net/test/read.cgi/unix/1028825681/
【UNIX板 過去スレ】 //-- S A M B A --//
http://pc.2ch.net/test/read.cgi/unix/990671952/
【Linux板→UNIX板へ誘導】Samba 総合スレッド Part 1
http://pc.2ch.net/test/read.cgi/linux/1033484457/
【Linux板→UNIX板へ誘導】神よsambaで・・
http://pc.2ch.net/test/read.cgi/linux/1025703896/

8 :うっかりさん:02/10/24 00:36 ID:+IrVemkB
一般に全文検索エンジンを使うとき、インデックス作成やクエリーに際して
NTFS の ACL (Access Control List) や EFS (Encrypted File System)
に対する考慮が必要になる場合があります。またプロパティの扱いに関連して
NTFS のファイルストリームに対する理解が必要になる場合があります。
そこで NTFS に関連するスレッドをまとめておきます。

【現行スレ】■□NTFSですよね?もしやFATですか?□■
http://pc3.2ch.net/test/read.cgi/win/1026314440/
【3代目スレ】■□NTFSですよね?それともFATですか?□■
http://pc3.2ch.net/test/read.cgi/win/1013265206/
【2代目スレ】■□NTFSですか?それともFATですか?□■
http://pc3.2ch.net/test/read.cgi/win/1011699920/
【初代スレ】フォーマット時の 「FAT」 or 「NTFS」
http://pc3.2ch.net/test/read.cgi/win/1001784245/

9 :うっかりさん:02/10/24 00:41 ID:+IrVemkB
富士ゼロックス DocuWorks 5.0 用のフィルタ
http://www.fujixerox.co.jp/soft/docuworks/download12.html

>>5 のリンク先には DocuWorks 4.0.1 用のフィルタがあります。

#あらかじめメモ帳でテンプレ用意して一気にスレ立てたのですが、
>>3 で2ゲットされちゃいますた・・・(笑 恐るべし Windows 板。

10 :うっかりさん:02/10/24 01:11 ID:+IrVemkB
Indexing Service なんて使ってないよ、という人へ。

Indexing Service は Windows 2000, Xp の標準機能です。

スタートメニューの「コンピュータの管理」から、
Indexing Service の各種設定を行うことができます。
ちなみにクエリー画面(検索画面)はこんな感じです。

http://sakots.pekori.jp/imgboard/imgs/img20021023215922.jpg
(日本語 Windows を使える環境にないので、表示が英語になってます。
 アイコンは同じはずなので大体わかると思いますが、すみません。)

ただし、インストール直後はオフになっていると思います。
ツリーの Indexing Service というところを右クリックして Start します。

----------------------
Thanks to サ骨タンのうpろだ
http://sakots.pekori.jp/imgboard/imgboard.cgi


11 :つづき:02/10/24 01:16 ID:+IrVemkB
まれにカタログを格納するフォルダがあらぬところに設定されていることがあります。
私の場合、なぜかありもしない E:\ にカタログを作るように設定されていました。

ツリーの System というところを右クリックして、一旦削除してしまい、
Index Service のところを右クリックして新しいカタログを作るといいと思います。
カタログはいくつでも作ることができます。

クエリー画面で Advanced ラジオボタンを選択することで、かなり複雑な
検索式を指定することができます。たとえば @filename"kernel" と指定すると、
パスに kernel という文字列が含まれるファイルを見つけてくれます。
Tips for Searching をクリックすると、検索式に関する詳細なヘルプを見ることができます。

12 :名無し~3.EXE:02/10/24 01:19 ID:nO/np+AM
なんか>>1のおかげでまた作ってみようかなと言う気持ちになってしまった・・・

13 :うっかりさん:02/10/24 01:33 ID:+IrVemkB
>>8
NTFS 4代目スレはすでに 980 を超えているため、次スレがたっています。

【NTFS 5代目現行スレ】■□NTFSですね?まさかFATですか?□■
http://pc3.2ch.net/test/read.cgi/win/1035291965/

14 :うっかりさん:02/10/24 16:00 ID:+IrVemkB
何の参考になるかわかりませんが、私のメイン環境を書いておきます。

M/B P2B-D
Pentium II 450MHz * 2
Memroy 512MB
Video Matrox G450 Dual Head
Windows XP Professional 英語版 w/SP1

ISA bus につなげた Sound Blaster 16 の音が鳴らない・・・
デバイスとしては認識しているのに。 Creative のサイトでは
ISA 接続のものは Windows XP の標準のドライバで動くって書いてあるのになぁ。

15 :うっかりさん:02/10/24 16:03 ID:+IrVemkB
今、試していること
>>10 のウィンドウでの設定が、ユーザごとにどう変わるのか。

User が Administrators, Power Users, Users など、どのグループに所属するかで、
できること・できないことがどう変わるのかな、と。

16 :うっかりさん:02/10/24 22:02 ID:+IrVemkB
Indexing Service の関連プロセス
Task Manager で見ることができます。

cisvc.exe = Indexing Service の本体
cidaemon.exe = カタログの数だけ起動されます

Services を見ればわかりますが、デフォルトでは cisvc.exe は
Local System account 権限で起動されます。
したがって Task Manager において User Name は SYSTEM になっています。

17 :うっかりさん:02/10/25 12:05 ID:Rhz1F9o7
Indexing Service が NTFS の ACL をどう反映するかは、
このドキュメントにも記述があります。
Security Tips
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/indexsrv/html/ixarch_0o6r.asp

とはいえ、Platform SDK のドキュメントを全部読むのはつらいですよね・・・
Platform SDK: Indexing Service
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/indexsrv/html/ixabout_1605.asp

18 :名無し~3.EXE:02/10/28 18:07 ID:CD7DL7zB
保守 sage

19 :関連スレッド:02/11/01 03:53 ID:IFNW4bYz
全文検索ユーティリティ統一スレッド
http://pc.2ch.net/test/read.cgi/bsoft/1006680403/

オープンソースの全文検索ソフト
http://pc.2ch.net/test/read.cgi/linux/1036088927/

20 :*.msg ファイル用フィルタ:02/11/03 02:21 ID:QCMb6fl8
MSG IFilter by ALNA
http://www.componentsource.com/ProductCatalog/MSGIFilter.htm

Search for information within MSG documents.
Alna’s MSG IFilter expands standard functionality of
Microsoft Internet Information Server, Microsoft SharePoint Portal Server
and all other products, based on top of Microsoft Index Server.
MSG IFilter performs searches inside saved e-mail messages (of MSG format)
and indexes all valuable information, so that users can easily search for text
within MSG documents and their attachments.

21 :名無し~3.EXE:02/11/07 19:27 ID:PdpEv/6t
s

22 :名無し~3.EXE:02/11/09 13:49 ID:IRyni+FV
こんな糞高い物買えるか!!
MSの馬鹿!!

23 :名無し~3.EXE:02/11/09 22:12 ID:gqA9emif
>>22
Indexing Service は Windows 2000, Xp の標準機能です。
SharePoint Portal Serverは大きな会社が買うものです。

うちは中小企業なので、ASPと組み合わせて社内のファイルサーバ(Windows Server)を
検索できるようにしただけで大好評でした。
ローカルファイルの検索ならAccessでフロントエンドを作るとGood!

24 :名無し~3.EXE:02/11/12 17:18 ID:JvhqrOGI
>>23 イイコトキイタ。

25 :名無し~3.EXE:02/11/14 01:04 ID:pd9DLhVs
Indexing ServiceとExcelで全文検索のマクロを作ってみた。
あまりテストしてないので、使うときは自己責任で。
http://fhewfhew.hp.infoseek.co.jp/IdxsrvQuery20021113.zip

26 :25:02/11/16 01:09 ID:7JZkw1Mh
インデックスサービスとExcelでの全文検索のマクロ
バージョンアップしました。
・ソート機能を追加
・インデックスサービスのヘルプ表示機能を追加
http://fhewfhew.hp.infoseek.co.jp/IdxsrvQuery20021115.zip

27 :名無し~3.EXE:02/11/16 01:51 ID:Bu71ZvA4
テキストファイルしかダメなの?


28 :25:02/11/16 02:33 ID:7JZkw1Mh
インデックスサービスとExcelでの全文検索のマクロ
またまた、バージョンアップ
・カタログの選択をフォームで行うようにした。
・検索するディレクトリを選択できるようにした。
http://fhewfhew.hp.infoseek.co.jp/

>>27
Windowsが標準でサポートする文書、Office文書、一太郎、PDF,ドキュワークスなどに対応しています。


29 :名無し~3.EXE:02/11/16 18:01 ID:Ei4XXGSV
>>28
かちゅログ用のIFilterを書いてほすぃ。


30 :名無し~3.EXE:02/11/17 23:59 ID:4gEV2MGu
>>29
DAT2HTMLを使いましょう。
http://members.tripod.co.jp/tatsu01/

31 :25:02/11/18 20:50 ID:IaFUOvn3
バージョンアップしてみた。
これで完成かな?
http://fhewfhew.hp.infoseek.co.jp/

32 :名無し~3.EXE:02/11/19 00:14 ID:jmbS1mN/
一太郎とかってどやって対応して居るんだろうね
インスコすると対応モジュールでも入るのかな?

33 :名無し~3.EXE:02/11/19 09:31 ID:ngOpN2rb
>>32
http://www.microsoft.com/japan/sharepoint/downloads/IFilter.asp

34 :名無し~3.EXE:02/11/20 00:55 ID:7ddvZ19z
良スレ age

35 :名無し~3.EXE:02/11/29 19:23 ID:xz0S3oaG
いま必要ないけど、もうちょっとしたら使うと思うから、保全age

36 :25:02/12/08 21:01 ID:V+694RNC
【インデックスサービスとExcelでの全文検索のマクロ】
大きなバグがありましたゴメンナサイ。

修正内容
・更新日による検索結果に漏れがあった。更新日の指定方法を変更。
・項目名、メッセージの一部を変更

http://fhewfhew.hp.infoseek.co.jp/

37 :名無し~3.EXE:02/12/08 23:50 ID:0RvfDI8e
>>36 良スレ!

38 :こんなの見つけたよ:02/12/08 23:57 ID:mmJ0hzUr
ちょっと気分転換して下さい
あなたの探してるもの見つかるかも
おすすめメニューの中に何か隠されてるみたい
その中のバナー開いてみて
「コンピュータ・家電」のカテゴリで探してね
教育・スクール・学習
衣料・ファッション・アクセサリー
商店・モール
本・雑誌各種
ギフト・花
食品・飲料・関連
ソフトウェア
日用品・家具・園芸
百貨店・スーパー・コンビニ
懸賞・ポイントサービスもあるよ
http://momolin.fc2web.com/


39 :名無し~3.EXE:02/12/09 00:55 ID:WNZPZxBq
セキュリティは大丈夫なのか? >index service
以前は穴の宝庫だったが。

40 :名無し~3.EXE:02/12/09 01:41 ID:Pt6eIovw
>>39
今年は脆弱性の報告は無いと思う。
サービスパックをあててあるなら大丈夫だよ。

41 :名無し~3.EXE:02/12/14 17:33 ID:LSzJRsAm
保守

42 :ひろゆき:02/12/15 00:37 ID:3Eozr/yo
こんにちは。みなさんお元気ですか?
2ちゃんねるの管理人の、西村博之です。
2ちゃんねるは最高の荒らし掲示板です。匿名でムカつくやつをけちらすことができるところがいいですね!
みなさんもどんどん、むかつくやつを誹謗中傷しましょう!
逝ってよし! はかっこいい!


43 :名無し~3.EXE:02/12/18 22:38 ID:4wU0FuoV
http://fhewfhew.hp.infoseek.co.jp/image/satori_beta.gif

44 :名無し~3.EXE:02/12/19 23:51 ID:gVdAhQKk
IFilterの作り方とかどっかにのってるのかな

ってかなり努力不足でスマソ

45 :名無し~3.EXE:02/12/23 01:43 ID:BJFhOPFi
まず、これを読め
http://www.microsoft.com/japan/sharepoint/techinfo/Other/

46 :名無し~3.EXE:03/01/02 18:10 ID:bMCmuzEg
usのmsdnも嫁

47 :fhew ◆inDExNNjx. :03/01/03 20:18 ID:EHWxYwjd
インデックスサービスによる全文検索ソフト
サトリ ver.1.00 をリリースしました。
http://fhewfhew.infoseek.ne.jp/

Excelマクロで公開したものを、Visual Basicで作り直したものです。
今回はインデックスサービスを理解できていない方でも使えるように考慮しました。

サトリをリリースしたので、Excelマクロは公開中止です。

48 :応援あげ:03/01/03 22:04 ID:J6kHdD44
>>47
こういうソフトが出てきてはじめて、Index Service が認知されていくんだろうなぁ、一般ユーザに。
このスレへのリンクも張っておいてもいいと思うよ・・・

49 :名無し~3.EXE:03/01/04 00:18 ID:fEehhY8n
神降臨記念age

50 :名無し~3.EXE:03/01/09 01:21 ID:DArjw3EZ
サトリ使わせて頂きました。素晴らしいです。
これでインデックスサービスがもっと活用されるようになるといいですね。

ただ自分の場合、アドビのIFilterを用いたPDFのインデックスが
Win2000(SP3)では出来ているのにXPpro(SP1)環境で出来ないという不具合で
トホホな状態です。IFilter5.0はXP対応してると書いてあるのに…


51 :名無し~3.EXE:03/01/09 01:54 ID:9ThpNPNj
Σもろふしあなさん!?>>535

52 :名無し~3.EXE:03/01/09 02:39 ID:rSiHpw7c
73 :ひろゆき ◆3SHRUNYAXA :03/01/08 17:27 ID:rLfxQ17l
   >ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
   ・今までより、サーバが重くなる。
   ・裁判所や警察からの照会があった場合にはIPを提出することがある。

   こんなところでしょうか。

89 :ひろゆき ◆3SHRUNYAXA :03/01/08 17:29 ID:rLfxQ17l
   >一般人からも見れるところ? 〉記録所
   既存のdatとは別に保存してるので、サーバがクラックされない限りはみれません。

   ただ、既存のdatと別なので、書きこみあたりの保存容量がほぼ2倍。

53 :名無し~3.EXE:03/01/09 03:23 ID:kLDUNk1d
よし、こんどこそ1000ゲット!!


54 :名無し~3.EXE:03/01/09 18:31 ID:Mtn4QYfq
======2==C==H======================================================

         2ちゃんねるのお勧めな話題と
     ネットでの面白い出来事を配送したいと思ってます。。。

===============================読者数: 138720人 発行日:2003/1/9

年末年始ボケがそろそろ収まり始めた今日このごろのひろゆきです。

そんなわけで、年末に予告したIP記録ですが実験を開始しています。

「2ちゃんねる20030107」
こんな感じで各掲示板の最下部に日付が入ってるんですが、
20030107以降になってるところはログ記録実験中ですー。

んじゃ!

────────────────────────Age2ch─
■この書き込みは、Age2chを使って配信されています。
────────────────────────────
Keep your thread alive !
http://pc3.2ch.net/test/read.cgi/software/1041952901/l50
────────────────────────────

55 :名無し~3.EXE:03/01/11 23:53 ID:pEzeGZ24
サトリ ver.1.00 ありがたく使わせていただいております。

ところが,使っていると

エラー箇所 :SetData
エラーコード:94
エラー内容 :Nullの使い方が不正です

 となって,終了することがあります。
 未だ再現性がわからないのですが,なにかアドバイスがありましたら
お願いいたします。

 OS W2K  メモリ 184MB 

56 :fhew ◆inDExNNjx. :03/01/13 19:48 ID:MIhC0qYO
>>55
ver.1.01をリリースしました。
この不具合を修正したつもりです。

57 :55:03/01/13 20:25 ID:nTA8Pa5K
>>56 fhew 様
 どうもありがとうございます。

さっそく使わせていただきました。似たような操作をしてみましたが,大丈夫です。
ありがたく使わせていただきます。

58 :名無し~3.EXE:03/01/13 21:18 ID:1RiKdI2B
検索はいいが置換はできんの?
もしできたらunixなんていらなくなるわけだが。

59 :名無し~3.EXE:03/01/13 22:08 ID:ib9xRtZ+
検索しろ。

60 :名無し~3.EXE:03/01/13 22:09 ID:sMRRVI6V
4ndって何?

61 :名無し~3.EXE:03/01/13 22:09 ID:hIK2bdn2
779 名前:スゴイ人  ◆y.GuoEaXhM 投稿日:03/01/11 11:43 ID:mqJGw88D
俺のことが言いたいんだろ?
ストーカーみたいに追いこんでくるね、ほんと。
2003・1・11
2ちゃん閉鎖ってなったらどう?
ありえなくもないだろ?

http://live2.2ch.net/test/read.cgi/news/1041948269/l50

62 :名無し~3.EXE:03/01/13 23:25 ID:qwg5emhB
これはバナクリ対策の罠ですか?

63 :山崎渉:03/01/15 14:04 ID:EQfdPNzz
(^^)

64 :ひろゆき:03/01/20 21:16 ID:oTq7YBne
           
       / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
 Λ_Λ  | 君さぁ こんなスレッド立てるから          |
( ´∀`)< 厨房って言われちゃうんだよ             |
( ΛΛ つ >―――――――――――――――――――‐<
 ( ゚Д゚) < おまえのことを必要としてる奴なんて         |
 /つつ  | いないんだからさっさと回線切って首吊れ     |
       \____________________/



65 :名無し~3.EXE:03/02/05 22:51 ID:wKGwvq17
.

66 :名無し~3.EXE:03/02/21 10:37 ID:7llpR1VO
保守

67 :名無し~3.EXE:03/03/09 19:06 ID:NTVyAxbI
PC初心者板から流れてきました。
すみません、2つ教えてください。
W2kでインデックスサービスを走らせているのですが、拡張子がlogと言うファイルも
検索対象に含ませたいのですが、どうしてもできません。
どうやったら検索対象に含ませることができるのでしょうか?
未登録の拡張子のファイルにインデックスを付ける、にはチェックを入れている
のですが・・・

特定の拡張子だけインデックスに加える方法を知っている人がいたら教えてください。

もう一つですが、W2kで標準で起動しているsystemのカタログのディレクトリを
勘違いしていくつか削除してしまいました。
現在残っているのは、
C:\Documents and Settings\Default User\Local Settings\Temporary Internet Files\*
C:\Documents and Settings\Default User\Local Settings\*
がインデックスしない、に設定されているのですけど、他には何があるか、
W2kを使っている人自分の設定を見て教えてもらえないでしょうか。
削除しても良いのでしたら全部削除するのですが、それも分からなくて・・・


68 :名無し~3.EXE:03/03/10 01:17 ID:8GZNJZ3C
>>67
レジストリエディタで
HKEY_CLASSES_ROOT\.log\PersistentHandler が
(既定) REG_SZ {5e941d80-bf96-11cd-b579-08002b30bfeb}
になっていればテキストとして検索対象となり、
「未登録の…」にチェックしてあればたしかインデックスにも含められると思いますが、
どうなってますか?

あとSystemのカタログディレクトリは、いろいろ設定をいじっちゃったんで思い出せないけど、
デフォルトの状態ではCドライブの殆どのファイル(テンポラリを除く)が対象になってしまい非効率です。

たとえば「Gikoフォルダの中身をインデックス構築したいがMonaフォルダの中身は除外したい」という場合
カタログのディレクトリは
C:\……\Giko 「はい」(インデックスに含める)
C:\……\Giko\Mona* 「いいえ」(インデックスに含めない)
とするわけです。つまり「いいえ」とする部分は「はい」とする部分に含まれていることが大前提で、
「いいえ」の指定だけではインデックスが正常に作成されないと思いました。


69 :67:03/03/10 23:42 ID:3H82w4fy
>>68
レスありがとうございます。
HKEY_CLASSES_ROOT\.log\PersistentHandlerはありませんでした。
HKEY_CLASSES_ROOT\.logはありましたが、中身はREG_SZ txtfileとだけ
なっていました。
68で教えていただいたレジストリキーを手打ちで入れれば検索対象に
含めることは出来るのでしょうか?


70 :68:03/03/11 03:22 ID:fbQrb+Vo
>>69
できると思うんですけどねー。

くれぐれもレジストリ操作は慎重にしてくださいね。


71 :保守係:03/03/17 22:47 ID:hGLCnBlL
どっこいしょ

72 :名無し~3.EXE:03/03/19 13:14 ID:G4g0Aw4K
ちょっと質問させてください。

環境:Windows 2000 + IIS で ウェブ・サーバを立てています。
主なソフトウェアとして、FrontPage2002 を使っています。

2ch の特定のスレの過去ログを保存して、自サイト内で発言の検索が出来るようにしたいのです。

以前はNAMAZU を使ってHTMLファイルを分割してインデックスを作成していました。
上記のようにすると、検索結果を選択すると、その発言の行へジャンプしてくれます。

一つのソフトで事足りればそれにこしたことは無いと思い、
FrontPage2002 でウェブの検索フォームのテンプレートがあるのでそれを使って検索ページを作成しました。

この検索のエンジンはIndex Service です。でもHTMLを分割してインデックスを作成することが出来ず、
検索結果は、まるごとそのページ全体しか認識せず、行単位でのジャンプが出来ません。

何とかインデックス・サービスでこの機能を実現できないものでしょうか?


73 :名無し~3.EXE:03/03/19 13:25 ID:x4Ej//xf
WinDo!!

毎月13日発売!!

74 :名無し~3.EXE:03/04/04 15:02 ID:KxNg2ZZy
サトリ 2.00βが出てました。
http://fhewfhew.hp.infoseek.co.jp/

75 :名無し~3.EXE:03/04/04 22:57 ID:ITBPbQhu
KWIC Finderがお勧め
http://plaza3.mbn.or.jp/~h_ishida/

76 :fhew ◆NKR2cRlGXU :03/04/13 21:11 ID:6AC5DEVS
サトリ 2.00をリリースしました。
<<変更点>>
・開発言語をVisual Basic 6.0からVisual Basic.netに変更。(ソースをすべて書き直しました)
・イントラネットでIISを利用して公開してるWebサイトの検索可能にした。
・文書のタイトルも検索対象とすることを可能にした。
・ファイル名による絞り込みを可能にした。
・ファイルの種類による検索対象の絞り込みをコンボボックスで行うようにした。
・検索するファイルの種類(拡張子)を登録するようにした。
・検索するカタログから「すべて」を削除した。
・検索結果一覧の項目を減らした。
・ファイルの種類表示でアイコンを表示するようにした。
・起動時の検索条件の初期値を指定できるようにした。
・各種設定の保存をレジストリに変更した。
・制限ユーザ(Users)でも実行可能にした。
・検索スピードが向上しました。

http://fhewfhew.hp.infoseek.co.jp/

77 :名無し~3.EXE:03/04/13 21:14 ID:JXhCAWb6
uhoxtu!

78 :名無し~3.EXE:03/04/14 12:58 ID:vkSctrT1
大幅変更があったようですが、サトリの旧バージョンはアンインスコした方が良いんでせうか?

79 :fhew ◆NKR2cRlGXU :03/04/14 19:01 ID:6VAahA8o
>>78
旧バージョンをインストーラ版で導入した場合は
「アプリケーションの追加と削除」でアンインストールしてください。

インストーラを使っていなければ新バージョンと共存できます。

80 :78:03/04/14 23:08 ID:hR8H6Ihm
>>79
ありがとうございました。早速インスコさせて頂きました。
右下の[<][>]ボタンが時々反応鈍いことがありますが、検索機能などその他は今のところ順調です。

81 :名無し~3.EXE:03/04/16 00:38 ID:708l/r51
Windows XpでIFilterをインストールしたのにPDFを検索できません。
インストールして再起動、インデックスを再スキャンしたのですが、
まだ、何か作業が必要ですか?


82 :名無し~3.EXE:03/04/16 19:03 ID:zepohnGn
>>81
↓の330ですが、どうもXPだとPDF IFilterが正しく機能してくれないようです。
http://pc2.2ch.net/test/read.cgi/bsoft/1006680403/330-
結局私はWin2000に戻してしまいました。

この夏にAdobeはAcrobat6.0を出すそうなので、PDF IFilterも改良してくれるといいのですがね…


83 :山崎渉:03/04/17 11:36 ID:zaKXYlZf
(^^)

84 :名無し~3.EXE:03/04/17 18:37 ID:9HzQwQVn
XpでPDFの検索は無理っぽいですね。
AdobeのIFilterダウンロードページでは
Xpもサポートしているように書いてあるのだけど
http://forums.adobe.co.jp/cgi-bin/WebX?128@94.q0cxafpyinG.6@.123e9d31
http://bbs.infoseek.co.jp/Board01?user=fhewfhew

85 :英語が苦手:03/04/24 17:20 ID:t52vo0pS
Windows2000版IndexServiceは、サンプルプログラムが添付されていないのですが、
PlatformSDKに置いてあるというので、早速行ってみたところ,
どこにあるのかさっぱりわかりません。
わかる人いますか?

86 :名無し~3.EXE:03/04/24 17:25 ID:x546xlYE
http://www.microsoft.com/msdownload/platformsdk/sdkupdate/psdk-full.htm
これでいいのかえ

87 :名無し~3.EXE:03/04/27 13:37 ID:TTWnuFup
Satori ver.2.01 リリース歓迎age
http://fhewfhew.hp.infoseek.co.jp/


88 :名無し~3.EXE:03/04/27 13:39 ID:TTWnuFup
age損ないました ・゚・(ノД`)・゚・

89 :第二外国語はもっとだめ:03/04/27 20:25 ID:Wwdmt9sO
>> 86
サンクス。
でも、IIS SDKの中にないよー。

90 :名無し~3.EXE:03/05/16 18:45 ID:/rYvoZSN


91 :山崎渉:03/05/22 02:04 ID:384Tt9yL
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

92 :名無し~3.EXE:03/05/22 23:31 ID:LOOcg652
サトリ2.02が出てまっせ

93 :山崎渉:03/05/28 16:56 ID:hiv5bR9G
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

94 :名無し~3.EXE:03/05/28 17:05 ID:58fnph2H
あげまん

95 :名無し~3.EXE:03/05/28 17:14 ID:58fnph2H
Acrobat Reader 6.0英語版がでてるみたい。
IFilterの新しいのも早く出ないかな。
Xpでちゃんと動作する奴をおねがい。

96 :名無し~3.EXE:03/06/24 16:11 ID:FsqXOIkU
Satori 2.02 で検索結果をダブルクリックすると、さりげなく、1行下のファイルが選択&オープンされる場合があるのは、私だけ?
XP Pro 1600x1200 フルスクリーン。タスクバーは下ではなく左端。ただし、ウィンドウは最大化でも通常サイズでも発生しました。

右クリックで「開く」だと問題なし。この問題と、要 .Net Framework (Windows Update)なので、大勢で使うのはつらそう。

97 :fhew:03/06/24 18:01 ID:v8drg3ex
> Satori 2.02 で検索結果をダブルクリックすると、さりげなく、
> 1行下のファイルが選択&オープンされる場合があるのは、私だけ?
現象を確認しました。
ダブルクリックする場所がセルの下部だと1行下と誤認しているようです。
調べて直しておきます。
今週は忙しいので直ぐには対応できませんが


98 :96:03/06/24 19:29 ID:FsqXOIkU
>>97
おお、ありがとうございます。数ヵ月後でも、直れば嬉しいです。

99 :名無し~3.EXE:03/06/26 15:45 ID:kSqwpoi8
まあこれは常識だけどな
アイドル時にディスクがりがりとアクセスするから
サービスでインデックスサービスってのを無効にしとけよ
確実性を求めるならコンパネの追加と削除で削除するのが吉

100 :名無し~3.EXE:03/06/26 15:46 ID:kSqwpoi8
ゲイツも何を考えてこんな糞機能搭載したのやら
オフィスのファインドファーストってのも糞だったが

101 :名無し~3.EXE:03/06/26 22:59 ID:lzeub0ra
パソコンをインターネットとゲームぐらいにしか使わないガキにはいらん機能だな

102 :名無し~3.EXE:03/06/29 23:41 ID:KUQUj2Jn
こんなに有意義で実りの多いスレッドにも、
何も知らないガキンチョが紛れ込んでくるんだなあ。

103 :名無し~3.EXE:03/07/03 00:47 ID:RttMtCQp
>>101-102

ほとんどのTIPSにインデックスサービスは切れと書いてあるのを知らない素人
FindFast時代からの常識なんだが

104 :名無し~3.EXE:03/07/03 01:30 ID:219yAHUl
>>103
おれ、ある開発案件に全文検索ってのが仕様に含まれてて
インデックスサービスを使うことも検討したのだが。
可能な限り標準でインストールされてるものを使うというポリシーだったので。

インデックスサービスって操作してないときにHDDがりがりやってくれるでしょ。
んで、試してみるとディスクキャッシュがそいつの構築のためだけにフラッシュされちゃうわ、
他のプロセスをswapに吐き出していざ使おうと思ったらしばらく待たされるわで
妙に反応がトロくなって使えねえなあ、と思った。

結局別の要因でインデックスサービスに機能が足りないので使うのはやめたんだけど。
指定した時間帯にインデックスを作るとかの指定できるのかなあ。
じゃないと使う気には到底なれない。

このスレを読んでるのはその調査のときに2chブラウザのお気に入りに
放り込んだままの惰性w

105 :名無し~3.EXE:03/07/03 01:58 ID:85nljR0C
>>104
単にメモリが少ないだけのように読めてしまう説明ですが、OSや機器の構成が知りたいですね。
今度、社内サーバー(Windows 2000 Server)で全文検索を行おうと思っているので参考にしたいです。
また、インデックスサービスの替わりに何を採用したのでしょう?

106 :名無し~3.EXE:03/07/03 02:55 ID:219yAHUl
>>105
あー、確かにスペック書かないとあんまり意味ないね。
試してみた環境は、

ThinkPad x22 Pen3/800MHz メモリ640M
OSはWindows2000 SP3

実機のスペックはこれよりメモリが少ない環境で、
各マシンにインストールするってものだった。

メモリはたりなくもないと思うけどどうなんだろう。

替わりに採用したのは、自分で全部作りますたw
候補としてはNamazuがあって使いたかったんだけど、
作ってるのがHTAの上で動くアプリケーションだし、
WEBサーバは入れちゃダメということだったし。
で、採用は見送った。
これはあんまり参考にならないね。


107 :名無し~3.EXE:03/07/03 14:05 ID:JBuNXEkW
>>103
素人?
まあ、確かに俺は素人だ。
サトリが出るまでは、そういうTIPS鵜呑みにして
MSインデックスサービス切ってたからな。

で、物知りで聡明な103は、わざわざこのスレッドに来て
MSのインデックスサービスに文句つけてるわけだから、
当然もっとコストパフォーマンスに優れたインデクサや、
検索ソフトを知ってるんだろうな。

108 :名無し~3.EXE:03/07/03 20:03 ID:kOADZpPA
>>106
640MBもあるならメモリは十分ですよね。
インデックスを全て作成し終わったときの負荷はチェックしました?
更新はあまり負荷かかんないと思うけど。
あとは標準のカタログのSystemを削除して、検索したい文書があるフォルダだけ
検索するカタログを作れば多少軽くなるかな。
細かいチューニングはレジストリを書き換える必要があると思う。
(アイドル時にインデックスを作成しない設定は無かったと思うけど。)

> 替わりに採用したのは、自分で全部作りますたw
さりげなく書いてあるが、これはすごい。
形態素解析方式、N-gram方式のどちらですか?
N-gram方式なら自分も作ってみたいけど、Officeの文書をOLEを使わずに
読み込む方法がわからないのでトライしたことないです。

109 :名無し~3.EXE:03/07/03 21:21 ID:2Awva4H2
なまず

110 :fhew ◆NKR2cRlGXU :03/07/04 00:52 ID:5C9/IInl
>>96
直しました。

111 :名無し~3.EXE:03/07/04 03:58 ID:uewE2e+t
>>108
インデックスを作り終わったあとの負荷チェックは、どうだったかな。忘れた。
おそらくインデックスを作らせつつインデックスサーバの仕様を読んでて、
欲しい機能がなかったので中断させちゃったのかも。
どんな機能が欲しかったのかも忘れちゃったスマンw

たしかにカタログを作る範囲を狭めたら負荷は下がるだろうね。

自作したつってもすごいことはなにもやってないよ。
形態素解析もngram法も使ってない。
UNIX MAGAZINEに載ったシグネチャ法を応用しただけ。
http://www.csl.sony.co.jp/person/masui/UnixMagazine/PDF/if9911.pdf
これね。データの特性に合わせてチューニングしてそこそこ実用的な速度は稼いだ。
アルゴリズムを理解してとりあえず動くものを作るのに半日、
チューニングで一週間くらいかけたくらい。安いし短いプロジェクトだったんで、
この程度で我慢してもらったw

だいたい、文書数が5000程度で平均検索速度は1秒弱くらいだったかな。
検索語の長さにもよるけど(短いほうが時間がかかる)、そんなもんだった。

officeの文書を読むのに汎用的な方法はOLEを使う以外にないだろうね。
いつの版からだったか忘れたけどXMLで保存するようになったらしいから(よくしらんのよ)、
それならOLE使わなくても読めそうだね。もっともUNICODE相手にしなきゃならんけどw

112 :名無し~3.EXE:03/07/04 10:21 ID:WwLJcQTO
> officeの文書を読むのに汎用的な方法はOLEを使う以外にないだろうね。
xdoc2txtが使えます。
http://plaza3.mbn.or.jp/~h_ishida/xdoc2txt.html

NamazuでOffice文書のインデックス作成はCPU負荷が100%になるとか、
エラーが出て止まるとかいろいろあるけど、以下のURLにある
「xdoc2txtを使用したNamazu用MS-WORD文書フィルタ」を使うといいみたい。
http://www.geocities.co.jp/SiliconValley-Oakland/8718/namazu/

でも、Windows 2000 Serverを使うならインデックス サービスが良いよ。
安定しているし、ほぼメンテナンスフリーだから。
NamazuはUnix系で使うものでしょ



113 :96:03/07/04 18:39 ID:YookM4IH
>>96 >>110
おお、確かに直ってる。私の癖だと、3割ぐらいの確率で別ファイルが開いていたので、これで楽に。
アンインストールが必要だけど、設定は残るみたい。

使うときは、「検索 → 役に立ちそうなファイルを1つのフォルダへコピーしまくり → 後でファイルを開く」
なので、使用頻度は低いけど。

ちなみに、Rational Unified Process という資料集(のお試し版)は、日本語資料なのに、
検索機能が英語のみ対応だった。製品版もそうなら、検索ツール常用かも。

114 :山崎 渉:03/07/15 11:39 ID:PgFZzGxa

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

115 :名無し~3.EXE:03/07/16 02:48 ID:X3T2Azq/
窓の杜にサトリ紹介記事キター
http://www.forest.impress.co.jp/article/2003/07/15/satori.html

116 :名無し~3.EXE:03/07/22 12:58 ID:UtbaaBvT
サトリ、みんなで同じ設定にするの面倒、というか無理・・・。
と思ったら、レジストリをインポートすればできるっぽい。問題ありそうだけど。
HKEY_CURRENT_USER\Software\fhew\Satori

なお、あらかじめ、サトリを普通にインストールしておく必要があります。

>>75
のソフトの製品版も良さそう。安いし。
でも、有料ソフトを使うと、ライセンス管理の手間が。

117 :fhew ◆NKR2cRlGXU :03/07/24 00:09 ID:YaO6WJoB
>>116
レジストリのコピーで問題ないです。

設定のエクスポート/インポート機能はテストしましたが、
サトリに実装するまでに至っていません。
次のバージョンには入れるかも。

118 :116:03/07/24 12:34 ID:UeMuR7R0
>>117
> レジストリのコピーで問題ないです。

ありがとうございます。設定をコピーできるので、サーバ名や拡張子の設定が楽です。
これなら、周囲の人に気楽にお勧めできる。

・・・次の仕事が来ないので、検索する必要無いっすか、なるほど。

119 :応援あげ:03/07/29 07:47 ID:bL1chbVp
>>115
いいねいいね〜〜〜

120 :応援あげ:03/07/29 07:47 ID:bL1chbVp
>>119
あげわすれてた。

121 :名無し~3.EXE:03/07/29 13:10 ID:r/ChwNoI
Indexing Service + IIS で実現した、検索ページのサンプルがありました。 スクリプトのソースも見れます。
http://riss.narc.affrc.go.jp/kssys/test/idxsrv.asp (トップページ: http://riss.narc.affrc.go.jp/kssys/asp/)


--- 自分の環境に合わせる手順 ---  (補完できる方がいらっしゃれば、手順の変更・追加をお願いいたします。)
・Satori 使用時の様に、インデックスサービスを設定する。 (例:カタログ名 = テストカタログ)
・↑で検索対象としたフォルダを、IIS の仮想ディレクトリとして公開する。 (例: エイリアス = test)
・スクリプト内の 「FormScope = "/kssys/asp"」 を書き換える。 (例:「FormScope = "/test"」)
・スクリプト内の 「Data Source=Web;」 を、Indexing Service で作成したカタログ名に書き換える。 (例:「Data Source=テストカタログ;」)
・書き換えた .asp を、IIS で 「test」 として公開したフォルダへ置く。
・IE で、http://<PC名>/test/<スクリプト名.asp> を開く。

一応動作しました。Word 文書も検索できます。
検索、文書のオープンはできますが、強調表示(「全文」と「要約」のクリック)は動作しません。
ついでに、Word 文書を開くと、妙に遅い場合があります。Proxy ソフト 「Proxomitron」 を経由ているからかも。

自分で使うだけなら、Satori の方が良さそう。
それでも、右クリックで「対象をファイルに保存」できるのと、元ファイルを変更不可に出来る点だけは、Satoriより良いかも。

大勢で使う場合、「最初は Web 版を使ってもらう → しばらく経ったら Satori を紹介する」 とか。

122 :名無し~3.EXE:03/07/29 13:47 ID:r/ChwNoI
>>121
> それでも、右クリックで「対象をファイルに保存」できるのと、元ファイルを変更不可に出来る点だけは、Satoriより良いかも。
Satori でも、共有フォルダをリードオンリーなら、同じ動作か。 一人で使うなら、Web 検索は嬉しくないなー。

123 :_/ ̄|○:03/07/29 13:50 ID:r/ChwNoI
> Satori でも、共有フォルダをリードオンリーなら、同じ動作か。 一人で使うなら、Web 検索は嬉しくないなー。
→ Satori でも、共有フォルダがリードオンリー共有なら、同じ動作か。 一人で使うなら、Web 検索は嬉しくないなー。

124 :fhew ◆NKR2cRlGXU :03/07/29 15:52 ID:jwCr+BO+
>>121
拡張子.htwのファイルをIISで有効にしなければ[全文]、[要約]は表示できない。
(セキュリティの関係でデフォルトではOff)
当然、[全文]、[要約]を表示する.htwファイルが必要。

125 :教えてください:03/08/01 09:49 ID:dfl9Cf4t
Windows 2000 SP4 にて Indexing Service を使用しはじめたのですが、
EXCEL文書でシートが4枚以上あるブックが「フィルタをかけていないドキュメント」に
なってしまい困っています。
対応方法がわかりましたらお教えください。


126 :ぼるじょあ ◆ySd1dMH5Gk :03/08/02 05:14 ID:GTyuweom
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ

127 :名無し~3.EXE:03/08/17 01:09 ID:0xfE3di2
良スレage

128 :応援あげ:03/08/20 23:52 ID:uIraBkGe
全文検索ユーティリティ統一スレッド
http://pc2.2ch.net/test/read.cgi/bsoft/1006680403/

最近fhewタンが来てくれない…ショボーン

41 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)