敏感词检测

敏感词检测服务

政治、色情、暴恐违禁、谩骂、违规广告 文本内容检测服务,

轻量程序,支持下载到本地运行,无调用次数限制直接使用,

无需耗费大量时间整理和维护词库。

简介

  • 用户昵称、聊天消息、直播弹幕、评论内容、用户简介等文本内容安全检测
  • 使用场景:游戏、直播、交互类App
  • 支持直接本地部署运行,http json方式或rpc方式调用
  • 单服务考参查询效率70000次/分钟
  • 支持多个服务同时运行,提高检测效率
  • 按需自定义添加和排除部分敏感词
  • 自动更新最新词库(商业版)

演示地址

坚果墙在线敏感词检测

支持的系统

  • Centos7.6_64位
  • Ubuntu20.04_64位

快速接入文档

文档地址

版本说明

版本说明

免费版

支持的敏感词种类

  • 色情:色情传播、x用品、av女优、色情描写、x器官、x行为、色情行为
  • 政治:领导人、官员、政党、国家机关、反动言论、邪教、分裂组织、宗教

提示

免费版接口和商业版接口完全一致,可以快速切换到商业版直接使用

部署

  1. 下载free目录所有文件到服务器目录
root@localhost svc# cd /root/svc
root@localhost svc# ls
config.ini  exclude.txt  include.txt  wordscheck\_free

程序运行需要能正常访问外网

设置config.ini参数,按需配置访问端口等

  1. 运行敏感词检测服务
root@localhost svc# ./wordscheck\_free
  1. 通过curl确认服务是否正常
root@localhost ~# curl -H "Accept: application/json" -H "Content-type: application/json" -X POST -d '{"content":"他在传播艳情内容"}'  http://localhost:8080/wordscheck

curl结果

{
	"code": "0",
	"msg": "检测成功",
	"return_str": "他在传播**内容",
	"word_list": [{
		"keyword": "艳情",
		"category": "色情"
	}]
}

需要时可以添加敏感词到include.txt,排除敏感词到exclude.txt

http方式接入

  • go例子

example/http/go_case.go

  • php例子

example/http/php/php_case.php

  • node.js例子

example/http/nodejs/nodejs_case.js

rpc方式接入

  • go例子

example/rpc/golang/go_case.go

  • php例子

example/rpc/php/php_case.php

  • node.js例子

example/rpc/nodejs/nodejs_case.js

商业版

支持的敏感词种类

  • 色情:色情传播、x用品、av女优、色情描写、x器官、x行为、色情行为
  • 政治:领导人、官员、政党、国家机关、反动言论、邪教、分裂组织、宗教
  • 暴恐违禁:枪支弹药、警用军用、涉黑涉恶、非法传教、毒品、假钞、刑事行为、违禁品
  • 谩骂:脏话、谩骂、地域攻击
  • 广告:冒充系统、违法买卖、金融广告、赌博、网络广告、广告词

部署

  1. 下载biz目录所有文件到服务器目录
root@localhost svc# cd /root/svc
root@localhost svc# ls
config.ini  exclude.txt  include.txt  wordscheck

程序运行需要能_正常访问外网、购买私钥

设置config.ini参数,按需配置私钥、访问端口等

  1. 运行敏感词检测服务
root@localhost svc# ./wordscheck
  1. curl确认服务,http/rpc方式接入

和免费版相同

同时部署运行多个服务

部署示例

本文转载于网络 如有侵权请联系删除

相关文章

  • Run minecraft on mac pro m1

    Runminecraftonmacprom1前言由于MC自带的必要动态链接库LWJGL的架构是X86,不兼容macprom1处理器的arm64架构,原生的MC是无法在m1上启动的;同时由于Apple强推了MetalAPI,在部分mod/光影/材质包上会有损失部分Feature的情况经典放送:基本设置见arm64minecraftwrapper完成配置后可正常启动Minecraftmod支持情况部分图形渲染相关mod会出现无法渲染文字/图像的情况光影支持情况m1下仅支持部分光影(部分光影会因为MetalAPI产生Error)欣赏经典:经过测试已支持的光影:https://github.com/MoustacheOff/AppleSilicon-Minecraft-Shaders推荐使用注意下载v1.20版本的Slidur'sShaders,高版本的在m1上有性能问题

  • 技巧 | json中文字符串中文乱码问题[通俗易懂]

    大家好,又见面了,我是全栈君。案例一今天面试被问到这个问题,明明以前是知道的,半年没碰之后,硬是没有想起来,只好硬着头皮说,tp自带的json助手函数是不会有这个问题的,场面一度十分尴尬。看例子把<?php header("Content-type:application/json;charset=utf-8"); $array=['中文','234','abc']; echojson_encode($array)复制返回结果:修改前PHP5.4版本后,已经给Json新增了一个选项:JSON_UNESCAPED_UNICODE。加上这个选项后,就不会自动把中文编码了。 修改后的代码 header("Content-type:application/json;charset=utf-8"); $array=['中文','234','abc']; echojson_encode($array,JSON_UNESCAPED_UN

  • 【傻瓜教程】S7-300与S7-300PLC之间的以太网S7协议单边通讯(工控公开课 今晚8点 老地方 不见不散!)

    剑指工控正文第一步:组态PLC1的硬件第二步:组态PLC2的硬件同第一步放方法一样,进行PLC2的硬件组态第三步:建立S7通讯连接第四步:进行通讯程序的编程第一步中建立的通讯连接是在PLC1里建立的,下面我们的单边通讯需要在PLC1里面进行通讯程序编程(如果在PLC2里建立的通讯连接,就需要在PLC2里进行通讯的相关编程)讲师简介工控班长(张勇):工业自动化高级讲师,高级技师,多年工业自动化项目现场经验,对工控行业有自己独特的理解,参与并设计/调试了多个国内中大型项目,主导完成了《西门子S7-200SMART综合应用教材》《西门子S7-300、400高级应用》《WinCC7.4高级应用》《EPLANP7电气制图》等多本自动化行业实训教材,在教学过程中不断的结合自己的项目经验和最新技术发展需求,调整教学方案,学员不但学会了知识,更多的学会了在工业现场处理问题的方法,风趣幽默的讲解方式也深受学员的喜欢。

  • 2021“数实融合”产业数字化助手关键词-学习大会精神!

    产业数字化“数实融合正在从‘选答题’,变成每个行业都要面对的‘必答题’,腾讯未来将打造用户、技术、安全和生态四大引擎,助力各行各业,发掘数字化新动能。”在2021腾讯数字生态大会上,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生表示汤道生认为,数字技术和产业互联网的发展正在从三个方面对社会和经济发展提供更强助力。社会公共服务持续发展,惠普化、即时化成为趋势,产业互联网可以助力提升公共服务的效率和潜能,帮助乡村振兴、城市治理、应急救灾等领域;借助云、AI、大数据等工具,生产、制造各环节变得可测量、可优化,助力中国制造向高端智能、绿色低碳升级;消费市场中,“内循环”为本土品牌提供了发展的土壤,数字化助力消费行业更加理解用户,助推国潮品牌崛起。对实体产业的价值助力是衡量产业互联网发展的重要标准。汤道生介绍,腾讯产业互联网在30多个行业,与9000家合作伙伴,打造了超过400个行业解决方案。未来,腾讯将立足优势能力,打造用户、技术、安全和生态四大引擎。打造用户引擎,将用户理解引入产业研发、生产、营销、服务,助力企业服务于人,激活增长;打造技术引擎,将前沿数字技术与产业落地融合,为产业升级提

  • SpringBoot 的多数据源配置

    最近在项目开发中,需要为一个使用MySQL数据库的SpringBoot项目,新添加一个PLSQL数据库数据源,那么就需要进行SpringBoot的多数据源开发。代码很简单,下面是实现的过程。 环境准备实验环境:JDK1.8SpringBoot2.4.1Maven3.6.3MySQL5.7因为我本地只有MySQL数据库,为了方便演示,我会在启动一个本地MySQL,在MySQL创建两个数据库,每个库中均有一个表,以此进行演示。数据准备本地MySQL端口默认不做改动,端口号3306。创建数据库demo1,demo2。在demo1数据库中创建表book。--createtable createtableBook ( idintauto_increment primarykey, authorvarchar(64)notnullcomment'作者信息', namevarchar(64)notnullcomment'书籍名称', pricedecimalnotnullcomment'价格', createTimedatetimenull

  • 使用Flow forecast进行时间序列预测和分类的迁移学习介绍

    ImageNet首次发表于2009年,在接下来的四年里,它成为了大多数计算机视觉模型的基础。到目前为止,无论您是在训练一个模型来检测肺炎还是对汽车模型进行分类,您都可能从在ImageNet或其他大型(和一般图像)数据集上预先训练的模型开始。 最近的一些论文,如ELMO和BERT(2018)利用转移学习来有效地提高几个NLP任务的表现。这些模型创建了有效的与上下文相关的单词表示。然后,这些表示可以用于各种任务,如回答问题、命名实体识别等。此外,在宏观层面上,转移学习为所有数据有限的领域的进展铺平了道路。通过帮助数据有限的研究小组和公司有效利用这种技术,它帮助了深度学习的大众化。因此,能够在时间序列领域(其中有许多有限时间历史的事件)中利用迁移学习是至关重要的。时间序列目前,时间序列的迁移学习还没有模式,也没有可去的地方。而且,对这一课题的研究相对较少。Fawazel的一篇论文(https://arxiv.org/pdf/1811.01533.pdf)。他讨论了时间序列分类的迁移学习。他们的结论是:这些实验表明,迁移学习可以改善或降低模型预测,但是取决于用于迁移的数据集。由此我们了解到,对

  • Unity打iOS包之xcodeapi的使用

    xcodeapihttps://github.com/onevcat/XUPorterhttps://bitbucket.org/Unity-Technologies/xcodeapi常用的的Property:Property值备注CODE_SIGN_IDENTITYp12证书的code_sign在钥匙串那里看双击钥匙串里已安装的证书最上面显示的标题就code_sign也叫“常用名称”DEVELOPMENT_TEAM证书的TeamId在钥匙串那里看,查看方法同上,“组织单位”的值就是TeamId使用project.SetTeamId接口进行设置ENABEL_BITCODEYES/NO关于Bitcode:https://www.cnblogs.com/QianChia/p/6223047.htmlIPHONEOS_DEPLOYMENT_TARGET8.0/8.1/8.2/…/12.1Unity打出来的默认是6.0目前最低必须设置为8.0以上PRODUCT_BUNDLE_IDENTIFIER项目的bundleIdcom.xxx.xxxxPRODUCT_NAME项目的名称PROVISIONI

  • JS ES各版本特性

    版本历史ES5浏览器可用性https://www.caniuse.com/#search=es5ES6浏览器可用性https://www.caniuse.com/#search=es6JS包含三个部分:ECMAScript(核心),DOM(文档对象模型),BOM(浏览器对象模型)。ECMAScript是JS语言的基础。 ECMAScript的最新版是第六版ECMAScript6,于2015年6月17日发布,截止发布日期,JavaScript的官方名称是ECMAScript2015,是当前最新的正式规范。ECMAScript的各个版本:(从第三版开始说)第三版ECMAScript3 新增了对正则表达式、新控制语句、try-catch异常处理的支持,修改了字符处理、错误定义和数值输出等内容。标志着ECMAScript成为了一门真正的编程语言。 第四版于2008年7月发布前被废弃。 第五版ECMAScript5力求澄清第3版中的歧义,并添加了新的功能。 新功能包括:原生JSON对象、继承的方法、高级属性的定义以及引入严格模式。 第六版ECMAScript6是继ES5之后的一次主要改进。 增添

  • 通过每年的人口普查数据,我发现中国人口结构正在恶化

    近些年来,总有媒体报道,中国在养老、医疗、教育各个行业出现的巨大的人力需求缺口,2017年左右,中国的“光棍危机”开始爆发,小编希望能够通过数据分析的方式搞清楚产生这系列问题的原因。小编作为一名数据分析师,手边正好有很多可以利用的资源,数据全生命周期的产品均是唾手可得。我先利用亿信华辰的亿信i@Report的“数据抓取”功能,从国家统计局公开的数据中抓取了“全国分年龄、性别的人口”数据。i@Report数据抓取方案有了这份数据,离真相又近了一步,小编甚是开心~数据抓取完成后全部存放在数据库中了。 i@Report数据抓取结果图 虽然从统计局抓取过来的数据信息非常完整,但我发现,抓取过来的数据包含特殊字符,比如空格;或者含有多余的信息,比如总计行,0-4岁,5-9岁等。这样的数据是一个汇总数据,而我需要的是明细数据,我需要对这份数据进行清洗、过滤。 我选择了亿信数据工厂产品,它是一款敏捷型数据处理工具,可以快速帮助用户处理、整合数据。现在需要将特殊字符和合计行数据处理掉,数据工厂清洗、过滤组件正好可以利用上。先新建一个ETL过程数据工厂中的组件多达几十种,完全可以满足我的清洗、处理数据的

  • Splunk Fundamentals 1 Lab Exercises

    换工作到新公司了,上级安排的第一个任务就是到splunk官网看视频学习,以下是一些记录笔记。splunk官网登录url:https://www.splunk.com/page/sign_up1、lab3  1.1、直接到官网下载好安装包后,放到/opt目录下,解压缩。  1.2、启动splunk:切换到splunk的bin目录下,然后sudo./splunkstart–-accept-license启动。2、lab4-ingestingdata  2.1、下载文件:http://splk.it/f1data  2.2、依次上传acc、db_audit、linux三个文件3、lab5-searching  3.1、搜索:errorORfail*  3.2、搜索:fail*ANDpassword"port22"  3.2、更改"JOB"menu,将读写权限改为everyone,时间改为7days4、lab6-usingfieldinsearches  4.1、搜索:index=mainsourcetype=access_combined_wcooki

  • 小程序在获取当前位置信息在地图上显示

    小程序在获取当前位置信息在地图上显示api:https://developers.weixin.qq.com/miniprogram/dev/api/wx.getLocation.html主要方法:wx.getLocation({ type:'wgs84', success(res){ constlatitude=res.latitude constlongitude=res.longitude } })复制这一步的时候,会出现在这样的提示:所以要进入app.json配置以下 参考API: https://developers.weixin.qq.com/miniprogram/dev/framework/config.html#permission配置授权信息的代码{ "pages":["pages/index/index"], "permission":{ "scope.userLocation":{ "desc":"你的位置信息将用于小程序位置接口的效

  • Spring源码初探-IOC(1)-Bean的初始化

    前言对于一名Java码农来说,Spring真是太重要了。目前Spring的体系已经发展得非常壮大,其底层基石core,beans,context非常牢固。spring体系结构图Bean初始化个人认为,Spring最原始或者最基础的功能是“容器”,帮你管理着一堆bean的生命周期,任你取用,要想更好的使用Spring,还是得了解Bean的整个生命周期,首先了解Bean的初始化过程。本文采用XML配置文件的方式管理bean,分析XmlBeanFactory对于XML文件的解析过程。废话不多说,先上图:SpringXmlBeanFacotry解析XML过程(1).jpg上图给出了XmlBeanFactory将xml配置解析成BeanDefinition的过程,最上面给出的类是在解析过程中涉及到的,首先大致进行一个介绍:Resource:是spring对于资源的一种抽象,因为资源的来源可能很丰富,利于File,ClassPathResource,UrlResource等,进行统一封装,暴露出getInputStream进行统一读取解析Document:这个没啥好讲的,XML文档对象Encode

  • Facebook 首次因数据泄密丑闻遭罚款:金额 66.4 万美元

    Facebook将因为剑桥分析(CambridgeAnalytica)数据泄露事件而面临第一次处罚——来自英国的66.4万美元罚单。英国信息委员会办公室(ICO)周二宣布对Facebook罚款,66.4万美元是处罚金额上限。他们认为Facebook缺乏强有力的隐私保护措施,而且忽视了有望阻止剑桥分析操纵舆论的重要信号,其中也包括2016年英国脱欧公投。在与Facebook进一步沟通之后,此项处罚可能会有所调整。ICO通常不会披露初步结果,但他们表示,此次之所以这么做,主要是因为公众对此十分关注。该机构还承诺将在10月份更新内容。Facebook首席隐私官艾琳·伊根(ErinEgan)在周二的声明中承认,Facebook本应采取更多措施调查跟剑桥分析有关的声明,并在2015年采取行动。英国的处罚可能只是开始。欧洲其他地区和美国同样也在调查此事。例如,美国联邦贸易委员会也有可能对Facebook处以巨额罚款。美国联邦调查局和证券交易委员会也在调查Facebook与剑桥分析之间的联系。伊根提到了很多与该公司有关的调查。“我们一直在与ICO就剑桥分析的调查展开密切合作,同时也在跟美国和其它国家

  • 重磅:SRS 5.0正式支持GB28181

    支持GB28181是正确的事情,可能也是困难的事情,因为困难所以有趣。Introduction在非常多朋友的努力下,SRS的GB功能不少,详细可以参考srs-gb28181[1]。由于GB和摄像头的复杂性,问题也是不少的,特别是稳定性问题,这也是为什么GB一直迟迟没有进SRS5.0分支的原因。现在SRS5.0已经临近功能封版了,我们增加了几个大的功能和改进,最后一个功能就是在考虑是否支持GB。鉴于GB目前的稳定性表现,肯定不能完全合并过来,是否能有稳定性更高的合并办法?如果减少功能,当然稳定性就会提升,所以SRS5.0可能的合并方式,就是只合并一个最简单的GB的能力,我们就叫它PoC吧。我列一下我知道的GB的功能清单:1. 摄像头通过SIP注册。srs-gb28181支持。PoC支持。2. 自动邀请摄像头推流。srs-gb28181支持。PoC支持。3. GB/2016转RTMP协议。srs-gb28181支持。PoC支持。4. 基于TCP的SIP信令。srs-gb28181支持。PoC支持。5. TCP单端口传输媒体。srs-gb28181支持。PoC支持。6. 基于UDP的SIP信

  • 【转】Linux - CentOS 7网络配置

    Linux-CentOS7网络配置 https://blog.csdn.net/J080624/article/details/78083988   安装完VM后,需要进行网络配置。第一个目标为可以进行SSH连接,可以从本机到VM进行文件传送。 故,VM中centos需要可以独立访问外网! 【1】修改网络配置文件 安装完CentOS7时,网络是通的。此时网络配置如下: 网络配置文件路径: /etc/sysconfig/network-scripts/ifcfg-enp0s3复制 1 其中“enp03”是你的网卡名称。 TYPE="Ethernet" PROXY_METHOD="none" BROWSER_ONLY="NO" BOOTPROTO="dhcp" DEFROUTE="yes" IPV4_FAILURE_FATAL="no" IPV6INIT="yes" IPV6_AUTOCONF="yes" IPV6_DEFROUTE="yes" IPV6_FAILURE_FATAL="no" IPV6_ADDR_GEN_MODE="stable-pri

  • 淘宝直通车推广计划

    1.推广计划的命名公式 推广目的 低价引流 高投产 带动搜索 终端 推广方式 建议:产品名称、型号+时间+其他 如:蓝牙耳机A12-0107-主推 或蓝牙耳机A12-0107-低价引流-无线主推   2.计划的权重 一个宝贝不再推广,应该从计划中删掉(不受历史权重影响) 新推广的宝贝最好放在一个新的计划或者14天未推广的计划里(不受历史权重影响) 如果一个计划开的不好,可以换一个试试 3.计划的设置 1.日限额 如何确定日限额 1.1销量导向,倒推日限额 例:销量目标月售900件=日售30件、单品转化率5%算出日均须的访客=30/5%=600个行业PPC(比如0.3元)则日限额=0.3*600=180元 1.2投产导向 投产盈利,可以不设日限额(看长期数据14天以上)投产平衡点=1/利润率 (利润率=利润/售价)低于投产平衡点亏,高盈利 略亏可多开,亏的严重不开 1.3前期怎么设置 100-300元最低30元,不要一次性设置较高的数值(比如日预算300元,则先设置50元看消耗速度快则降低出价,再加30元,慢则可以设置到300元) 1.4直通车每天投

  • GORM 中文文档

    由于篇幅问题,本文只是快速开始部分,下面是完整地址。 中文文档地址:http://gorm.book.jasperxu.com/ 中文文档项目地址:https://github.com/jasperxu/gorm-cn-doc Golang写的,开发人员友好的ORM库。 概述 全功能ORM(几乎) 关联(包含一个,包含多个,属于,多对多,多种包含) Callbacks(创建/保存/更新/删除/查找之前/之后) 预加载(急加载) 事务 复合主键 SQLBuilder 自动迁移 日志 可扩展,编写基于GORM回调的插件 每个功能都有测试 开发人员友好 安装 goget-ugithub.com/jinzhu/gorm 复制 升级到V1.0 更新日志 快速开始 packagemain import( "github.com/jinzhu/gorm" _"github.com/jinzhu/gorm/dialects/sqlite" ) typeProductstruct{ gorm.Model Codestring Priceuint } funcmain(){ db,err:=

  • CF1648D Serious Business 题解

    前言 关于此题,CF的官方题解是利用线段树优化DP,但在赛后,hehezhou提出过一种利用cdq分治优化DP的解法,然后蒟蒻便在神仙\(\color{balck}{\textB}\color{red}{\text{indir0}}\)的帮助下成功用cdq分治通过了本题 题解 设\(dp_i\)表示从\((1,1)\)到\((2,i)\)的最大权值,有转移: \[dp_i=\max\limits_{j<i}\{dp_j+s_{2,i}-s_{2,j}-\text{cost}(i,j)\} \]\(s_{i,j}=\sum_{k\lej}a_{i,k}\),\(\text{cost}(i,j)\)表示同时包含\((2,i),(2,j)\)的花费最小的一个offer 初始值: \[dp_i=s_{1,i}+a_{2,i}-\text{cost}(i,i) \]那个\(\max\limits_{j\lei}\)很烦,要\(O(n^2)\)做,直接cdq分治变为\(O(n\logn)\) 在来看如何快速地求\(\text{cost}(i,j)\) 在cdq分治时,设当前分治范围为\([L

  • mongodb 安装教学

    安装文件:mongodb-win32-x86_64-2008plus-ssl-3.2.6-signed.msi 电脑配置:win764位 MongoDB的安装很简单,设置好安装路径后,一直Next直到安装结束,最大的坑就是MongoDB服务的安装,下面具体说下MongoDB安装之后的一些配置操作 【声明】我的安装路径是:D:\ProgramFiles\MongoDB\Server\3.2 1.创建数据库路径(data目录)、日志路径(logs目录)和日志文件(mongo.log文件),完成后如下图所示     2.创建配置文件mongo.conf,文件内容如下: [plain] viewplain copy   dbpath=D:\Program Files\MongoDB\Server\3.2\data #数据库路径   logpath=D:\Program Files\MongoDB\Server\3.2\logs\mongo.log #日志输出文件路径&n

  • 使用cygwin注意事项二

         使用cygwin时,一定要区分当前运行的是cygwin下的进程还是windows下的进程,如:使用vim,假如cygwin下没安装vim,windows下安装了,那么你运行的就是windows下的vim了,因为windows下的环境变量会被cygwin继承,所以调用命令时,在cygwin下没找着,也会到windows的环境变量上去找   那么如何区分当前运行的是哪里的呢,使用which命令 查看当前命令的路径在哪,如whichcmd,在我的机器上会显示:/cygdrive/c/Windows/system32/cmd,whichvim,在我的机器上就显示/usr/bin/vim(因为我在cygwin上安装了vim)。     出错情景:我的window系统上安装了gvim,在cygwin上也可以使用,但是安装一些插件时,就会因为插件文件的格式不对,导致安装不上(运行出错)      总结:在cygwin上使用相应的工具时,如git,vim,要区分它是cygwin上的还是window上的,不区分的话,会因为用户主目录的问题出问题的    作者:shanq

  • 二维数组实现01背包

    <script> varproDuctNum=5; varMaxCapicity=15; varValueArr=[4,5,10,11,13]; varCapicity=[3,4,7,8,9]; functionPackage_Value(Num,MaxCapicity,ValueArr,CaArr){      varresult=[];      for(vari=0;i<Num+1;i++){        result.push([]);      }     for(vari=0;i<Num+1;i++){       for(varj=0;j<Max

相关推荐

推荐阅读