作者CardLin (卡林)
看板MobileComm
标题Re: [新闻] 苹果将侦测儿童色情影像 用户上传iCloud
时间Sun Aug 8 02:15:34 2021
AI可以将图片分类,找出有问题的图片
具体做法有很多种,我们先简介目前效果最好的神经网路
首先会用数学模拟神经元的运算
简化来说每一层的网路输出(Output)就是输入(Input)乘上权重(Weight)再加上偏移(Bias)
Output = Input * Weight + Bias
而每个 Input 可以是一维、二维或三维的矩阵,Weight, Bias也是特定大小的矩阵
所以 Output 就会很像是脑袋里面神经网路的连结
https://imgur.com/fBbB0HA
所以当我有很多层的时候,就会像是小型脑袋
https://imgur.com/4QEmiLF
而这个小型的脑袋就可以透过已标注资料进行训练
假设 Apple 已经人工标定好 1000 张照片,其中 800 张正常,另 200 张异常
我们就可以透过训练这个小型脑袋,让他逐渐地学会如何分辨正常与异常
学习过程会计算最终的输出(FinalOutput)与真正的答案(GroundTruth)的差异(Loss)
透过这个 Loss 就可以透过数学的运算来微调需要修改的权重(Weight)与偏移(Bias)
最後训练完的神经网路的最终输出(FinalOutput)就会是以下例子:
一般照片:正常:0.99 (99%) 异常:0.01 (1%)
异常照片:正常:0.22 (22%) 异常:0.78 (78%)
通常类神经网路并不会用原始解析度进行训练
需要降维,例如先缩小到 224*224 的大小再进行训练
而经过训练後的神经网路就能很好地将图片进行分类
其实这种类似的做法已经有在手机相机软体上应用: 场景智慧辨识、眨眼侦测...等
如果有足够多的人工标注资料进行训练,已经可以轻松达到 99% 以上的成功率
如果设计够好,一台伺服器一秒要处理 100 张照片应该也没问题
毕竟在手机端的运算能力也都可以即时辨识场景
不在手机端分析照片的原因可能是避免增加耗电
Apple会对照片进行分析,主要当然是希望降低虐童犯罪
我刚刚 Google 了一下查到 "美国一年有高达76万5000名儿童失踪"
我不知道数据是否准确,但这些失踪儿童可能有大部分都跟虐童犯罪有关
希望 Google 也能跟进,让儿童更安全!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.44.67.182 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MobileComm/M.1628360136.A.6E6.html
1F:→ kkcity59 : 听起来好像很厉害...可是我看到的版本只是取Hash值 08/08 02:17
2F:→ kkcity59 : 去跟已知违法图档做对照 08/08 02:17
3F:推 s25g5d4 : 你看到的版本不够详细 08/08 02:18
4F:→ kkcity59 : 如果要这样分析的话大概得多放几个核心跟电池罗 08/08 02:18
5F:推 ZnOnZ : 希望 Google 不会跟进,这样很不安心 08/08 02:19
6F:→ s25g5d4 : 那是苹果要担心的事情,为什麽你要帮他们担心 XD 08/08 02:19
7F:→ kkcity59 : 一般人不开心的点是我明明不是性犯罪者 08/08 02:20
8F:→ kkcity59 : 你要花我手机电力跟运算力来检查我自己手机上的资料 08/08 02:20
9F:→ kkcity59 : 来跟你证明说我是清白的。 08/08 02:21
10F:推 s25g5d4 : 好,不爽不要用 08/08 02:25
11F:推 destiny3952 : 我觉得应该比较像是用autoencoder这类的方法 08/08 02:26
12F:→ CardLin : 原文只有上传iCloud才审查吧,不会用你手机的电量 08/08 02:26
13F:→ CardLin : Autoencoder的特性是不在资料集内的照片就会警报喔 08/08 02:28
14F:推 s25g5d4 : 会喔,比对是在装置端运作的 08/08 02:42
15F:推 abadjoke : 不是希望估狗跟进 是估狗早就有了 08/08 02:45
16F:推 benedict76 : 模型建立好手机喂图进去用aie运算没多久就有结果, 08/08 03:03
17F:→ benedict76 : 又不是要在手机上训练模型。 08/08 03:03
18F:推 puffycat : google早就这样做了!最近没看新闻吗? 08/08 04:09
19F:→ Benetnasch : 不要放照片在海水上不是基本共识吗? 08/08 18:39
20F:推 RonanXidi : 上传图片前,爱疯有说会检查吗? 08/08 18:40
21F:→ awerte : google早就做了,apple是最近才有消息 08/08 18:45
22F:→ spath : 一年有76.5万儿童失踪是怎麽来的?逛卖场时乱跑之 08/08 18:51
23F:→ spath : 後找回来这样有算吗? 08/08 18:51
24F:→ evanade : 那是累积报案数,一年少10%儿童人口数你会信? 08/08 19:00
25F:嘘 smallcar801 : 一秒100张… 没概念就不要误导人家了 08/08 19:54
https://imgur.com/50OIHT5
NVIDIA Tesla V100 使用 FP16 精度可达 28.26 TFLOPS
EfficientNet 的推论效能甚至每秒可以破 1000 张
我估计 100 张确实有点太少了,误导大家了,抱歉
26F:推 yahappy4u : 希望不要被独裁政府拿来打压异议者就好 08/08 21:54
27F:→ trywish : 其实在手机上做也没啥问题,每次增加一张照片比对一 08/08 22:27
28F:→ trywish : 个数字是能吃你多少电,当然从云端上比对也可以,像 08/08 22:27
29F:→ trywish : google就有新闻是"巡查"到照片才抓的,也都几年前的 08/08 22:28
30F:→ trywish : 事情了,当然排除这些,光侵犯隐私就是不可取。 08/08 22:29
※ 编辑: CardLin (114.44.83.81 台湾), 08/08/2021 22:50:15