生成AIを使う敵と戦う技術を研究しよう。

インターネットにはびこる言論弾圧から身を守るために、ITやインターネットの技術に強くなるためのフォーラム。
フォーラムルール
インターネットにはびこる言論弾圧から身を守るために、ITやインターネットの技術に強くなるためのフォーラム。
アバター
Emmanuel_Chanel
Site Admin
記事: 375
登録日時: 28 2 2013, 12:10
連絡する:

生成AIを使う敵と戦う技術を研究しよう。

投稿記事 by Emmanuel_Chanel »

Grok とか ChatGPT とかの生成AIを使って私達に反論しようとするのは、国内左翼の間でも流行りそうですし、外国人はもっとやりそうなので、対抗する技術をこちらも研究する必要がありそうです。
AI も誤情報を掴めば間違った事しか言わないという話を、AIが苦手な私なりに南京大虐殺は Grok があったと言っているからあった、AIにGIGOは当てはまらないと言う人 - posfie のようにしたりしましたが、外国人の頭のレベルでは無理なのかも知れません。
おにのふぐりさんの Grok が Grok も間違うと言っている画像は、使えそうだなと思います。英語で聞いてみても多分同様の答えが得られて再現出来るかなとも思います。
🇯🇵おにのふぐり🇯🇵 @onino_huguri
GrokクンがGrokも間違うって言ってますよ。
x.com-onino_fuguri-GqKvuvtagAAtSZp.jpg
午後4:14 · 2025年5月5日 · 2,700 件の表示
私の方でも3件ほど、おにのふぐりさんがした質問を日本語で Grok に投げてみました。 https://x.com/i/grok/share/X7Oh3v1bJOrS9TemxcuO92HsQ
思った通り、 Grok は無条件に信用できるものではない事を答えてきました。
ChatGPT に ChatGPT の出力は学術的なソースになるか英語で聞いたりもしました。ならないと否定されました。
Question: Can ChatGPT's outputs be valid scientific sources?
ChatGPT:

ChatGPT's outputs cannot be considered valid scientific sources. Here's why:

Not Peer-Reviewed: Scientific sources are typically peer-reviewed by experts in the field. ChatGPT's responses are not.

No Original Research: ChatGPT does not conduct experiments, gather data, or publish findings—hallmarks of a scientific source.

No Accountability: Scientific sources have identifiable authors and institutions responsible for their content. ChatGPT responses do not.

Information Accuracy: While ChatGPT can synthesize information based on its training, it may not always be accurate, up-to-date, or correctly cited.

However, ChatGPT can help in:

Explaining scientific concepts clearly.

Summarizing existing research.

Generating ideas or outlines for papers.

Locating references (with user verification).

If you're writing a scientific paper or doing research, you should always rely on primary or peer-reviewed secondary sources, and use ChatGPT only as a tool for support or clarification.

Would you like help finding reliable scientific sources on a particular topic?
まともな生成AIの技術者は、生成AI技術の限界を理解しているので、自分の作品に、自分たちは間違わないとか、そんな事は言わせないものなのだろうと思います。
ただ、海外の敵に、こういう話を持ち出すのが効果があるのかどうか、自信がなくなってきました。でも、生成AIで反論文を書く人間に負けない研究は引き続き必要なのだろうなという感じ。
私は慣れていないので別の人の成果も見れた方が有り難いですけど。
Emmanuel Chanel emmanuelchanel@gmail.com
The Owner of this phpBB board.
アバター
Emmanuel_Chanel
Site Admin
記事: 375
登録日時: 28 2 2013, 12:10
連絡する:

記事:ハルシネーションとは?生成AIを利用するリスクと対策を考える

投稿記事 by Emmanuel_Chanel »

人に、ハルシネーションとは?生成AIを利用するリスクと対策を考えるという記事を紹介して頂けました。
"生成AIにおけるハルシネーション"で調べるといいとも言われました。ハルシネーションという言葉は、Xで敵と何となくやり取りしていて理解していた感じですが、私も基礎が出来ていないので、ネットで分かる範囲だけでも調べて勉強した方がいいのかなと思います。
このスレを建てる事で考えていたのは、生成AIを使って反論文をぶつけてくる敵を如何にやっつけるかという感じで、このような基礎的な話の研究でもなかったのですが、基礎的な話を知らないと、出来る反論も出来なくなる事もあるので、知っておかないといけないなという感じです。
Emmanuel Chanel emmanuelchanel@gmail.com
The Owner of this phpBB board.
アバター
Emmanuel_Chanel
Site Admin
記事: 375
登録日時: 28 2 2013, 12:10
連絡する:

Grok に査読論文について2件質問を投げてみました。

投稿記事 by Emmanuel_Chanel »

査読論文について言っている事について、おかしな点はないのでしょうが、こちらが敵を相手にするには、よく読んで論理構成する必要があるかなという感じでした。
査読された論文はいつも正しいですか?

直接の回答
  • いいえ、査読された論文はいつも正しいわけではありません。
  • 査読プロセスは品質や信頼性を高めますが、誤り、バイアス、方法論の欠陥を見逃す可能性があります。
  • 研究では、査読済み論文の約2-4%が撤回され、誤りや再現性の問題が報告されています。
論文の正確性を評価するには、方法論、データ、引用元を検証し、複数の研究で裏付けを確認する必要があります。
背景と簡単な説明
査読(peer review)は、学術論文の質を確保するためのプロセスで、専門家が内容、方法論、結論を評価します。しかし、査読者も人間であり、誤りや偏見を見逃すことがあります。また、研究の再現性危機(例:心理学や医学の研究の40-60%が再現できない)や、データ操作、出版バイアス(肯定的な結果が優先される傾向)も問題です。
例えば、2020年のCOVID-19関連論文で、査読済みでも誤ったデータに基づくものが撤回されました。したがって、論文を信頼する際は批判的思考と追加の検証が不可欠です。
結論
査読済み論文は高い信頼性を持ちますが、常に正しいとは限りません。誤りや限界を見極めるため、方法論やデータを精査し、他の研究で結果を確認することが重要です。

詳細な調査ノート
以下の調査は、2025年5月31日現在の情報に基づき、査読された論文の正確性と信頼性を評価します。学術的な基準、問題点、統計データを考慮し、詳細に分析します。
査読プロセスの概要
査読(peer review)は、学術誌に投稿された論文を、独立した専門家が評価するプロセスです。目的は以下の通り:
  • 品質管理:方法論、データ、結論の妥当性を確認。
  • 信頼性向上:明らかな誤りや不正を排除。
  • 客観性確保:バイアスや主観的な主張を減らす。
プロセスには通常、シングルブラインド(著者名が公開)、ダブルブラインド(著者と査読者の双方が匿名)、またはオープン査読があります。しかし、査読は完全ではなく、以下のような限界があります。
査読済み論文の限界と問題
  • 人間の誤り
    • 査読者は専門家だが、誤りや方法論の欠陥を見逃す可能性がある。
    • 例:2020年、LancetとNEJMに掲載されたCOVID-19関連論文が、データ不正(Surgisphere事件)で撤回された(The Scientist)。
  • 再現性の危機
    • 多くの分野で、査読済み論文の結果が再現できないことが問題。
    • 心理学では、2015年のReproducibility Projectで、100件の研究のうち39%しか再現できなかった(Nature)。
    • 医学では、50-60%の研究が再現性に欠けると報告(PLOS Medicine)。
  • 出版バイアス
    • 肯定的な結果(統計的に有意な結果)が優先的に出版され、否定的な結果や失敗が報告されにくい。
    • 研究では、臨床試験の約50%が未公開または否定的結果を隠していると推定(BMJ)。
  • 不正とデータ操作
    • 査読プロセスは意図的な不正(データの捏造、改ざん)を完全には防げない。
    • Retraction Watchによると、2022年までに約2-4%の査読済み論文が撤回され、理由は誤り、不正、倫理違反など(Retraction Watch)。
  • 査読者のバイアス
    • 査読者の個人的な偏見や競争関係が評価に影響することがある。
    • 例:知名度の高い著者や機関の論文が有利に扱われる傾向(Nature)。
統計データ
以下のデータは、査読済み論文の問題を示します:
  • 撤回率:査読済み論文の約2-4%が撤回(Retraction Watch Database)。
  • 再現性:心理学の研究の61%、医学の50-60%が再現不可(Nature、PLOS Medicine)。
  • 出版バイアス:臨床試験の約50%が未公開または結果が歪曲(BMJ)。
問題 統計 出典
撤回率 2-4% Retraction Watch
心理学の再現性 39%のみ再現可能 Nature, 2015
医学の再現性 40-50%のみ再現可能 PLOS Medicine
未公開臨床試験 約50% BMJ

具体例
  • Surgisphere事件(2020)
    • 査読済みのLancetとNEJMの論文が、COVID-19治療(ヒドロキシクロロキン)に関する偽データを掲載。査読で見抜けず、撤回された(The Guardian)。
  • 心理学の再現性
    • 2011年の「プライミング効果」研究(高齢者に関する単語で歩行速度が遅くなる)は査読済みだったが、後の再現実験で結果が一致せず、疑問視された(Nature)。
論文の正確性を評価する方法
査読済み論文を信頼する際、以下のステップで検証が推奨されます:
  • 方法論の確認
    • 研究デザイン、サンプルサイズ、統計手法が適切か評価。
    • 例:サンプルサイズが小さすぎると、結果の一般化が難しい。
  • データの透明性
    • 生データや補足資料が公開されているか確認。
    • オープンアクセスデータ(例:Dryad、Figshare)が理想。
  • 引用元の精査
    • 論文が引用する研究が信頼できるか、原典をチェック。
  • 再現性の裏付け
    • 他の独立した研究で同様の結果が報告されているか確認(例:メタ分析)。
  • ジャーナルの質
    • インパクトファクターやジャーナルの評判を考慮。ただし、高インパクトでも誤りはあり得る。
  • 撤回履歴の確認
    • Retraction Watch Databaseで論文や著者の撤回歴を調査。
査読の改善と将来の展望
査読の限界に対処するため、以下の改革が進行中:
  • オープン査読:査読者のコメントや身元を公開し、透明性を向上。
  • プレプリント:査読前にarXivやbioRxivで公開し、早期フィードバックを得る。
  • 再現性チェック:ジャーナルが再現実験を要求(例:Natureの再現性基準)。
  • AIの活用:AIツールでデータ不正や統計エラーを検出(例:Statcheck)。
しかし、これらの改善でも完全な正確性は保証されず、研究者の批判的思考が不可欠です。
社会的影響とリスク
  • 誤情報の拡散:誤った査読済み論文が政策や医療に影響(例:COVID-19のヒドロキシクロロキン誤報)。
  • 信頼の喪失:再現性危機や撤回が増えると、学術研究への信頼が低下。
  • 倫理的問題:不正やバイアスが社会的な不平等や誤った意思決定を助長。
結論
査読された論文は常に正しいわけではありません。査読は品質を高めるが、誤り、バイアス、再現性の欠如、不正を見逃す可能性があります。統計では、2-4%の論文が撤回され、心理学や医学の40-60%が再現できないと報告されています。論文の正確性を評価するには、方法論、データ、引用元を精査し、複数の研究で裏付けを確認する必要があります。研究者や読者は批判的思考を持ち、一次資料やメタ分析を活用して信頼性を確保すべきです。

主要引用
査読論文を経た学説への査読されていない批判はいつも無価値ですか?

直接の回答
  • いいえ、査読されていない批判はいつも無価値というわけではありません。
  • 査読されていない批判は、斬新な視点や新たな疑問を提供し、学説の再評価や改善を促すことがあります。
  • ただし、信頼性や説得力は、批判の根拠、論理、データに依存し、査読済みの学説と同等の厳密さは保証されません。
  • 価値を判断するには、批判の内容、著者の専門性、裏付けの質を慎重に評価する必要があります。
背景と簡単な説明
査読済み論文は厳格な評価を経て信頼性が高いとされますが、誤りや限界が存在します。一方、査読されていない批判(ブログ、プレプリント、SNSなど)は、迅速に新しい視点を提供可能ですが、品質管理が欠如し、誤情報やバイアスのリスクがあります。
例として、プレプリントでの批判が後に査読済み研究で検証され、学説の修正に繋がったケースがあります。批判の価値は、論理的な一貫性や証拠の質に依存し、査読の有無だけで決まるものではありません。
結論
査読されていない批判は無価値とは限りませんが、信頼性は低い場合があります。批判の論理、データ、著者の背景を精査し、可能なら査読済みの研究で裏付けを確認することが重要です。

詳細な調査ノート
以下の調査は、2025年5月31日現在の情報に基づき、査読済み学説に対する査読されていない批判の価値を評価します。学術的な基準、事例、潜在的なリスクと利点を分析します。
査読済み学説と査読プロセスの概要
  • 査読済み学説:査読(peer review)は、専門家による評価を通じて論文の方法論、データ、結論の妥当性を確認し、学術的な信頼性を高めます。
  • 限界:前述の通り、査読済み論文でも2-4%が撤回され、心理学や医学の40-60%が再現性に欠ける(Nature、Retraction Watch)。
  • 査読は品質を保証しますが、完全な正確性や最終的な結論を意味しません。
査読されていない批判の特性
査読されていない批判は、ブログ、プレプリント(arXiv、bioRxiv)、SNS、フォーラム、書籍などで発表されます。特徴は以下の通り:
  • 利点
    • 迅速性:査読プロセス(数か月~年単位)を経ず、即時に意見を共有可能。
    • 多様な視点:学術界外の専門家や市民科学者が新たな疑問や仮説を提示。
    • オープンな議論:プレプリントやSNSで広範なフィードバックを集め、学説の改善を促す。
  • 欠点
    • 品質管理の欠如:査読がないため、誤り、バイアス、根拠のない主張が含まれるリスク。
    • 信頼性のバラツキ:著者の専門性やデータの質が不明確な場合が多い。
    • 誤情報のリスク:Xやブログでの批判が、検証なしに拡散し、混乱を招く(TechCrunch)。
査読されていない批判の価値:事例
  • 肯定的な事例
    • プレプリントの貢献:2020年のCOVID-19パンデミック時、査読前のプレプリント(bioRxiv、medRxiv)が、迅速な情報共有で研究を加速。例:mRNAワクチンの初期データがプレプリントで公開され、後の査読済み論文で検証された(Nature)。
    • 市民科学者の批判:アマチュア研究者がブログで気候モデルの欠陥を指摘し、後の研究で問題が確認され、モデルが改善されたケース(The Scientist)。
    • 価値:新たな視点や迅速なフィードバックが、学説の再評価や修正を促す。
  • 否定的な事例
    • 誤情報の拡散:2020年、査読されていないブログやSNSで、ヒドロキシクロロキンがCOVID-19に有効との主張が広まり、誤った希望や混乱を招いた。後の査読済み研究で無効と判明(The Guardian)。
    • 根拠薄弱な批判:一部の査読されていない批判は、データや論理的根拠がなく、学術界で無視される場合も(例:反ワクチン主張のブログ)。
    • リスク:誤った批判が信頼を損ない、科学的な進歩を妨げる。
価値の判断基準
査読されていない批判の価値は、以下の要素で評価すべきです:
  • 著者の専門性
    • 批判者が該当分野の知識や経験を持つか(例:学歴、研究実績)。
    • 例:気候科学者のブログ批判は、匿名投稿より信頼性が高い。
  • 論理と根拠
    • 批判が論理的で、データ、計算、または観察に基づいているか。
    • 例:数値モデルや実験データで学説の欠陥を示す批判は価値が高い。
  • 透明性
    • データや方法が公開され、検証可能か。プレプリントはしばしばデータを提供するが、ブログでは稀。
  • 影響と検証
    • 批判が他の研究者により検討され、査読済み研究で裏付けられたか。
    • 例:プレプリントの仮説が後に査読論文で確認されれば、価値が証明される。
  • 文脈
    • 批判が学説のどの部分(方法論、結論、解釈)を対象とし、建設的か。
統計データ
  • プレプリントの利用:2020年、COVID-19関連のプレプリントは50,000件以上投稿され、約30%が後に査読済み論文に(Nature)。
  • 撤回の背景:査読済み論文の2-4%が撤回されるが、査読されていない批判の誤り率は定量化困難(Retraction Watch)。
  • 再現性:心理学の査読済み研究の61%が再現不可。査読されていない批判がこれを指摘し、改善を促すケースも(PLOS Medicine)。
項目 統計 出典
プレプリントの査読化 約30% Nature, 2021
査読済み論文の撤回 2-4% Retraction Watch
心理学の再現性 39%のみ再現可能 PLOS Medicine
社会的影響とリスク
  • 利点:査読されていない批判は、迅速な議論を促進し、学術界の硬直性を打破。市民科学や新興研究者の参加を促す。
  • リスク:根拠のない批判が誤情報を広め、査読済み学説への信頼を損なう。例:SNSでの反科学的主張が公衆の混乱を招く(TechCrunch)。
  • 倫理的配慮:無責任な批判は研究者や政策に害を及ぼし、科学の進歩を遅らせる。
批判の価値を高める方法
  • 根拠の提供:データ、計算、観察結果で批判を裏付ける。
  • 透明性:方法やソースを公開し、検証を可能にする。
  • 建設的アプローチ:学説の改善案を提示し、対話的な議論を促す。
  • プレプリントの活用:arXivやbioRxivで批判を公開し、早期フィードバックを得る。
  • 検証の追求:査読されていない批判を、後の査読済み研究で裏付ける。
結論
査読されていない批判はいつも無価値ではありません。斬新な視点や疑問を提供し、学説の再評価や改善を促す可能性があります。例えば、プレプリントがCOVID-19研究を加速したように、価値ある批判は科学の進歩に貢献します。しかし、品質管理の欠如や誤情報のリスクがあり、信頼性は査読済み学説より低い。批判の価値は、著者の専門性、論理、根拠の質に依存します。研究者や読者は、批判を慎重に評価し、可能なら査読済み研究や一次資料で裏付けを確認すべきです。

主要引用
https://x.com/i/grok/share/5KwZm7J5AOChCt90BRfEESezp より
Emmanuel Chanel emmanuelchanel@gmail.com
The Owner of this phpBB board.
返信する