Telegram 在俄语国家的互联网上非常流行。由于 Facebook 被封锁,Twitter 被限制,现在它成了俄罗斯互联网用户完全可以使用的最后一个社交网络应用之一。
自俄罗斯入侵乌克兰以来,Telegram成为了获取战争相关信息的重要工具 — — 普通乌克兰人定期发布视频和照片,证明战争造成的破坏规模。这些材料能够帮助确定对平民的多次袭击的地理位置,并确定俄罗斯军队使用集束弹药的情况。
但目前俄罗斯和乌克兰的网络媒体环境非常不稳定。将内容存档,可以确保在用户删除帖子、频道被删除或整个平台无法访问的情况下,研究人员仍然可以使用这些内容。对于任何类型的互联网内容,链接会随着时间的推移而失效,这种现象被称为 “链接腐烂”。存档内容可以将其保存多年。
2 月 25 日,Telegram 频道@MariypolCalling 发布了一段俄罗斯军队在入侵前的调度视频。在撰写本文时,由于假定的审核操作,该帖子不再可见。
如果你在看到它时就把它存档了,就不会担心这种情况。
这是因为 Telegram 是最容易存档的通信平台之一,也是最后一个可以保存图像元数据的平台 — — 这对用户来说有隐私风险,但对开源情报研究者来说往往是个福音。Telegram 的聊天记录导出格式也使其很容易使用谷歌翻译来翻译整个频道。即使是对于非技术用户,步骤也非常简单。
如何存档一个特定的帖子、图片或视频
存档媒体的最简单方法是使用 Telegram 桌面应用程序,该程序可用于 Windows、Mac 和 Linux。然后,您可以通过简单地在图片或视频上点击右键并点击 “另存为… ” 来保存媒体。如果图片被附在文件中,它也将包含所有原始元数据。
您可以在 Telegram 应用程序中查看任何信息,即使您不是某群组的成员,也可以这样做。如果您有一个格式为 https://t.me/euronews_tr/2011 的帖子的URL, “VIEW IN CHANNEL” 将允许你在 Telegram 应用程序中打开它。
此外,明智的做法是对原始帖子进行截图,以保存时间戳、用户,并记住您是在哪里找到的媒体项目。更进一步的,您可以通过转发到 Show Json Bot 并将返回的 JSON 内容保存在一个单独的文本文件中,来保存整个帖子内容和元数据的完整副本。
请注意,敏感的或私人的信息永远不应该被转发给机器人。保存元数据很有用,因为它包含了帖子中尽可能多的信息,包括用户ID、聊天ID和完整的时间戳。
如何存档整个频道或群组
Telegram 超越了其他聊天平台,它的特点是可以导出整个聊天记录,包括文件和媒体在内的人可读和机器可读的格式。然而,这一功能在Mac OS上是不可用的。如果您使用 Mac 或 Linux,最简单的方法是使用 Windows 虚拟机。VMWare Fusion 为非商业用户提供免费许可,关于如何使用它的指南可以在这里找到。
首先,在 Telegram 应用程序中通过从对话中选择或搜索来打开一个聊天。Telegram 的聊天可以是私人对话、频道(单个用户向听众广播)或群组(许多用户聊天)。有时公共频道会作为在线预览链接分享。如果您有一个这样的链接,格式为 https://t.me/s/[用户名],点击该频道的用户名将提供一个在 Telegram 应用程序中打开它的选项,前提是您的计算机上安装了该平台。也可以使用这些预览网址来寻找某些隐藏在搜索结果中的频道。
在打开一个群组或频道的情况下(即使是您正在预览而没有关注的频道),点击右上角的菜单按钮并选择 “导出聊天记录”。
有几种导出设置可供选择。勾选每一个方框将导出频道中包含的所有媒体。最大化大小限制可以捕获尽可能多的媒体,但要注意,这可能会大大增加导出时间。
有两种格式可供选择,HTML或JSON。HTML格式是为人类可读而设计的。它可以在网络浏览器中打开,对人工审查最有用。JSON格式被设计为机器可读,在导出数据进行进一步分析时最有用。
您也可以指定一个日期范围。如果只想得到全部频道档案的一个子集,这可以加快进程。最后,点击 “导出” 开始导出过程。对于大型聊天历史记录,这可能需要几个小时。
要查看导出,在网络浏览器中打开 messages.html 文件即可。
不过目前还不能用这种技术导出频道评论。
如何翻译 Telegram 的信息
Telegram 最近在移动应用程序中增加了一个翻译功能。通过进入 设置>语言>在应用程序中显示翻译按钮,来激活该功能。要翻译一条信息,按住它就会弹出一个上下文菜单,然后选择 “翻译” 选项。
但是,利用这一功能,您一次只能翻译一条信息。
通过将聊天记录导出为 HTML(如上所述)并在谷歌浏览器中打开,可以一次性翻译整个频道的内容。如果 Chrome 浏览器没有提供翻译页面,您可以通过右键单击并选择 “翻译成”(您喜欢的语言)来请求翻译。
数据抓取和API
对于高级用户来说,Telegram 的API也提供了非常开放的平台访问,使您能够轻松地对消息和媒体以及用户、频道和群组元数据进行存档。对于 Python 开发人员来说,Telethon 的API功能齐全,并且有完善的文档。
另一种下载 Telegram 消息的方法是使用非API的抓取工具。这种方法可能比 Telegram 的原生导出功能更快,但它只适用于公共频道,不适用聊天群组。JustAnotherArchivist 的工具 snscrape 在这方面效果很好,可以试试看。⭕️
How to Archive Telegram Content to Document Russia’s Invasion of Ukraine