1read 100read
2013年06月ソフトウェア582: 2ちゃんねるスレッド全文検索・・・ThreadSearch (514) TOP カテ一覧 スレ一覧 2ch元 削除依頼
【2chブラウザ】 実況向き 「NicoNico2ch」 Part1 (784)
けいおん厨が逆上するような悪口を教えてくれ (118)
Excel友の会 (515)
おまいらがGoogleにつくって欲しい無料ソフト (120)
ΨΨΨ KFを語ろう Part1 ΨΨΨ (652)
7-Zip総合スレ Part 8 (211)

2ちゃんねるスレッド全文検索・・・ThreadSearch


1 :2008/02/27 〜 最終レス :2013/05/18
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな

2 :
Styleの作者ならパクってくれると信じてる

3 :
取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!

4 :
よく見たらどの2chブラウザでもいいっぽいのかこれは

5 :
cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
http://pc11.2ch.net/test/read.cgi/software/1120578352/l50

6 :
JaneNidaの検索部分を抜き出したようなソフトだ

7 :
おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。
>>4
datファイルのあるフォルダならブラウザは何でもいいです。

8 :
>>5
あきらかに趣旨が違うから、ここでもいい気が。

9 :
これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。

10 :
地味に便利な予感

11 :
>>9
>htmlに吐き出す
できたぞ

12 :
“2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
http://namidame.2ch.net/test/read.cgi/news/1204783364/
ボロクソ言われてんぞ

13 :
>>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。
こっちに記事がでてますね。
http://www.forest.impress.co.jp/article/2008/03/06/threadzenbun.html

14 :
まあ、2chブラウザ自体に検索機能あるしね

15 :
誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな

16 :
言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。

17 :
専ブラのボードデータ読んで欲しいものだ

18 :
似たようなソフトが二つあるけど、その違いは?

19 :
>>18
もう一つは?

20 :
スレッド全文検索
http://www.geocities.jp/cen_hp/threadsearch.html
datファイル全文検索ソフト
http://www.geocities.jp/cen_hp/program2.html

21 :
Googleデスクトップでdatが検索できればいいんだけどなぁ

22 :
>>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって

23 :
age

24 :
板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。

25 :
>>21
使えるかは知らんが
Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html

26 :
>>25
おおー、これはすばらしい!
ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど

27 :
バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。
思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。

28 :
あっ、バッチじゃダメか…(^^;

29 :
レジストリか…さじ投げする。
すまない。NGしてくれい。

30 :
index作成型じゃないの?
すごくのろい。

31 :
>>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。
日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。

32 :
>>25
へえ。こういうのあるんですね。
>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。

33 :
>32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。

34 :
NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。

35 :
そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。
この機能は凄いありがたいんでどうにか高速化して欲しい

36 :
これ結構便利だ

37 :
cenさんありがとう、これ物凄い便利です
要望ってここで書いちゃっていいのかな?
追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと
最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。
御一考頂ければなぁ、と思います

38 :
>>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。

39 :
>>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね

40 :
>>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ

41 :
期待age

42 :
index作成型 期待
ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。
まあindex作成型なら板指定なんかする必要は無いとも思いますが。

43 :
index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。

44 :
>>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。
>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。

45 :
>インデックス方式
楽しみーに待ってるです

46 :
あげ

47 :
インデックスは独自?
それともnamazuとか使うの?

48 :
>>47
独自の方法でする予定です。

49 :
おはようございます。
スレッド全文検索を更新しました。
Ver 1.50になりました。
http://www.geocities.jp/cen_hp
更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。

50 :
インデックスを使うことで高速に検索できるようになりました。
http://www.geocities.jp/cen_hp/threadsearch.html#7
HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。

51 :
それから、検索結果はVer1.00と同様の結果が出ます。

52 :
あと、方法は独自と書きましたがほぼngram法です。

53 :
Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに
「インデックス作成中・・・ファイルリスト作成中」
と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・

54 :
>>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。
一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt

55 :
>>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。

56 :
>>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!
うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)
検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です

57 :
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。

58 :
>>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。

59 :
>>55
あと、ウインドウ・サイズも覚えておいて欲しい。
.NET Framework ソフトとしては軽いので結構期待してる。

60 :
うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。
祭日中にとっても乙

61 :
>>60
>不完全ぽい
kwsk

62 :
>>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.

63 :
index作成開始2時間半後で45%
まだまだ先は長いな。

64 :
使って頂いてありがとうです。
>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。
>>59
それもいいかもしれないですね。
>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。

65 :
5万1千程のdatで4時間半かかった。

66 :
初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。
indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?

67 :
>>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。

68 :
乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。
もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です

69 :
>67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)

70 :
>>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。

71 :
>>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?

72 :
どうもありがとうです
>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。
>>70
そういう方法もあるとは

73 :
あと、窓の杜で記事が掲載されました。
http://www.forest.impress.co.jp/article/2008/05/08/threadzenbun150.html

74 :
>>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます
>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。
>>73
窓の杜も細かく拾いますねw

75 :
俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな

76 :
ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか

77 :
.NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが

78 :
VCは.NETに比べて手間が10倍くらいに増えるからな。
起動速度だけのためにそんな手間はかけてられないって感じじゃね?

79 :
8.4ギガ程のログで3ギガ程のindexが出来ますた。

80 :
DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか

81 :
>>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。
>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。
>>80
そういうのもあるんですか。
ちょっと見てみます。

82 :
age

83 :
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   index追加型、急かしてないよ?        
 と__)__) +

84 :
急がせてるwwwwwwwwwwww

85 :
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   急かしてないよ、ホントだよ?        
 と__)__) +

86 :
Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/
こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ

87 :
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い

88 :
ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ

89 :
週末きたけどそろそろバージョンくる?

90 :
週末くるけどそろそろバージョンくる?

91 :
「バージョンくる」の意味が分からなかったのでグッてみた
ver・sion
━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.

92 :
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?

93 :
>86
バージョンこないから試してみようとしたけど起動しないや・・・

94 :
俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
         ∨
           ___                _
       / ____ヽ           /  ̄   ̄ \
       |  | /, −、, -、l           /、          ヽ きみ頭だいじょうぶ?
       | _| -|○ | ○||         |・ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_ ー  |     |
    | ̄ ̄|/ (_ ∪ ̄ / 、 \        \. ̄`  |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `− ´ |       | _|        /          |
【 南極堂...断罪アイアンメイデン 】  http://www42.atwiki.jp/ironmaiden/

95 :
どうもです。
ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。

96 :
待ってます

97 :
待っています。

98 :
みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?
これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。
indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。

あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。

99 :
>>98
何言ってる

100read 1read
1read 100read
TOP カテ一覧 スレ一覧 2ch元 削除依頼
【The Movie Player】MPlayer Part1 (250)
音質激改善 Fidelizer (278)
◆こんなソフトウェアつくってください〜Part17〜◆ (587)
【GC/Wii】ノートでDolphinする人のスレ【エミュ】 (170)
【電子マネー】Bitcoin【P2P】 (246)
★おすすめ圧縮解凍ソフトLhaz★3 (601)
--log9.info------------------
松本春姫 (111)
【尻】下半身が良いDVD、写真集【食込】 (190)
【東京少女】瓜生美咲 part1【おそめちゃん】 (175)
【CharmKids】宮野ここね Part1【デコちあ】 (197)
美咲あい (137)
西村理香 (156)
【CharmKids】藤川ひなPart1【ひよこ組】 (146)
【CharmKids】竹森ゆい Part1.2【WeCan☆Girls】 (150)
【CharmKids】星れいら Part1【R&R】 (183)
【桝岡明 改め】 眞木めい 【ムチャミタス】 (105)
【ポセイドン】 藤野志穂 【キュートな美少女】 (178)
★☆★エンプロ外原3姉妹 ゆうな みゆ しゅり★☆★ (131)
佐倉絵麻ちゃんを応援するスレ (155)
スレ立てるまでもない女子用 (104)
篠川桃音 (劇団コスモス幼稚部) (116)
【わたしの尻で】西野華ちゃん【目一杯抜いて!】 (151)
--log55.com------------------
【名無し限定】暇なので話しませんか?18873
誰にでもできることが困難すぎるメンヘラ2
「大丈夫、大丈夫」と書き込んだら大丈夫だよ 28
(ID非表示)チラシの裏・独り言 188
【名無し限定】統合失調症(旧・精神分裂病) 雑談スレ part38
【名無し限定】暇なので話しませんか?18904
【名無し限定】暇なので話しませんか?18905
【名無し限定】暇なので話しませんか?18906