目录
一、查看网卡
二、创建虚拟网卡
三、修改主机名
四、管理路由表
五、管理端口
六、网络通信
七、配置网卡
一、查看网卡
命令:ifconfig :查看当前可用设备
主要查看ip地址和mac地址
ifconfig +设备名:表示查看指定设备状态
ifconfig选项:-a表示查看所有设备(包含没有激活的网卡)
-s表示查询网络通信情况
设备类型:ens33本机网卡,lo:回环网卡,virbr0:虚拟网关
二、创建虚拟网卡
1.临时创建虚拟网卡
ifconfig ens33:0 192.168.140.12/24 创建临时网卡
2.管理网卡
添加网络适配器
可以看到ens37已经加入,但没有ip地址
在/etc/sysconfig/network-scripts文件里并没有ens37设备
ifup ens37开启设备
ifup ens37关闭设备
网卡断开,xshell连接不上,要到虚拟机中打开
断开网卡后,ip地址不见了
成功激活网卡ens33
3删除虚拟网卡
ifconfig ens33:0 192.168.140.14 down删除虚拟网卡
三、修改主机名
1.临时修改主机名
hostname +名字:表示修改当前用户的主机名
修改过后不会立即改变,学院su刷新一下
2.永久修改主机名
1.命令修改hostnamectl set-hostname local,同样修改完也不会立即改变,需要su一下
2.修改配置文件
/etc/hostname
四、管理路由表
1.查看路由表
route可以查看路由表信息,-n可以更加详细的看到
2.临时添加路由表
route add -net 192.168.140.0/24 gw 192.168.140.111 dev ens33配置静态路由
3.临时添加默认路由
可以看到默认路由创建成功
4.删除路由
1.删除默认路由 route del default gw 192.168.140.111删除了默认路由
2.删除指定路由
删除192.168.14.0到192.168.140.111的静态路由
5.永久创建静态路由
进入/etc/sysconfig/static-routes配置
表示所有流量从111通过
配好一定要重启网络服务
五、管理端口
1.netstat:端口扫描,查看端口是否正常工作
常用格式metstat -antp表示显示所有端口以数字方式tcp连接相关的进程信息
netstat选项:a所有信息,n以数字方式显示信息,r显示路由表信息,l显示处于监听状态,网络连接和端口信息(监听状态标识建立通信,端到端可以通信),t显示tcp协议,u显示udp协议,p显示与网络链接相关的进程号,进程名称信息(必须有root权限)
netstat -antp | grep tcp查看关于tcp的信息
2.ss:获取通信套接字,socket信息,用法和netstat基本一致
ss选项:a所有信息,n以数字方式显示信息,r显示路由表信息,l显示处于监听状态,网络连接和端口信息(监听状态标识建立通信,端到端可以通信),t显示tcp协议,u显示udp协议,p显示与网络链接相关的进程号,进程名称信息(必须有root权限),x表示内核相关
常用命令ss -antp
ss -antp |grep ssh指定查找ssh相关信息
3.netstat和ss区别:
1.ss速度比netstat快
2.ss使用连接较大的场景,netstat可能卡死
六、网络通信
ping:在linux表示长ping,会一直ping,window是默认5次
ping -c+数字 表示指定次数
ping -w表示超时等待时间
2.测试当前主机到目的主机网络节点
traceroute查看路径(类似window的tracert命令)
window的tracert命令
traceroute 8.8.8.8可以看到有三十个点到达谷歌
3.nslookup解析地址(正向解析:从域到ip地址)
nslookup+ip地址
nslookup+域名地址解析ip地址
4.dig +地址显示详细信息
5.dns解析地址
vim /etc/resolv.conf
进入网卡文件加入dns域名就行
6.映射文件
/etc/hosts:IP地址与主机名的映射文件(相当于单机版网页)
七、配置网卡
1.插入网卡
2.查看网卡ens37
3.找到网卡配置文件
4.因为新加入的网卡没有配置文件,将ens33的配置文件cp一份改为ens37
5.修改配置文件,网卡设备名和ip地址,uuid可以删除,不删可能报错
6.重启服务
systemctl restatue network ,查看网卡配置成功
位运算 任何信息在计算机中都是采用二进制表示的,数据在计算机中是以补码形式存储的,位运算就是直接对整数在内存中的二进制位进行运算。由于位运算直接对内存数据进行操作,不需要转换成十进制,因此处理速度非常快,在信息学竞赛中往往可以优化理论时间复杂度的系数(常数优化)。 C++提供了6种位运算符。符号含义作用&按位与"a&b"按二进制位进行“与”运算。如果两个相应的二进制位数字都为1,则该位的结果为1;否则为0。|按位或"a|b"按二进制位进行“或”运算。如果两个相应的二进制位数字有一个为1,则该位的结果为1;否则为0。^按位异或"a^b"按二进制位进行“异或”运算。如果两个相应的二进制位数字不相同,则该位的结果为1;否则为0。~取反"~a"将整数的各个二进制位都取反,即1变为0,0变为1。<<左移"a<<b"是指将整数a的各个二进制位左移b位,高位丢弃,低位用0补齐。>>右移"a>>b"是指将整数a的各个
在过去的几年中,随着微服务的增长,gRPC在这些较小的服务之间的相互通信中获得了很大的普及,在后台,gRPC使用http/2在同一连接和双工流中复用许多请求。使用具有结构化数据的快速,轻便的二进制协议作为服务之间的通信介质确实很有吸引力,但是使用gRPC时需要考虑一些因素,最重要的是如何处理负载均衡。gRPC使用粘性连接gRPC连接是粘性的。这意味着当从客户端到服务器建立连接时,相同的连接将被尽可能长时间地用于许多请求(多路复用)。这样做是为了避免所有最初的时间和资源花费在TCP握手上。因此,当客户端获取与服务器实例的连接时,它将保持连接。现在,当同一客户端开始发送大量请求时,它们都将转到同一服务器实例。而这正是问题所在,将没有机会将负载分配给其他实例。他们都去同一个实例。这就是为什么粘性连接会使负载平衡变得非常困难。以下是一些负载均衡gRPC相互通信的方法,以及每种方法的一些细节。1.服务器端当在服务器端完成负载均衡时,会使客户端非常精简,并且完全不知道如何在服务器上处理负载:网络负载均衡器网络负载均衡器在OSI(OpenSystemsInterconnection)模型的第4层运行
文章目录1.题目2.解题1.题目QW是一个回合制游戏的玩家,今天他决定去打怪。QW在一场战斗中会碰到n个怪物,每个怪物有攻击力atk[i],每回合结束时如果第i个怪物还活着,就会对QW造成atk[i]的伤害。 QW只能在每回合开始时击杀一个怪物,请帮QW出他打完所有怪物最少需要损失多少生命值。n,atk[i]<=100000 答案可能超过int范围 示例 样例1: 输入:atk=[19,3] 输出:3 样例2: 输入:atk=[1,3,2,5] 输出:10复制https://tianchi.aliyun.com/oj/245809026182441523/2677217338255653642.解题贪心,生命值大的优先打,然后损失后缀和的生命值classSolution{ public: /** *@paramatk:theatkofmonsters *@return:OutputtheminimaldamageQWwillsuffer */ longlonggetAns(vector<int>&atk){ //Writeyourcodehere sort
PHP是不是已经走到了尽头?这是近年来的一个热门话题,毕竟有很多互联网企业都在尝试推出其他开发语言,并且吸引了相当多的关注。例如Go以协程著称,Java则有着最完善的生态,而Python则在人工智能领域保持优势。但是,PHP依然是最流行的开发语言之一!1、PHP的开发进展PHP一直在进步,有许多优秀的开发人员都在为PHP的开发贡献力量,因此几乎每年都会发布PHP的新版本。7.3是2018年发布的,7.4将在2019年底推出:PHP7.0重建了内核,加入了新的zend引擎后,PHP的性能提高了2~3倍。2、PHP的框架一个开发语言是否足够强大,这和该语言的开发框架密切相关。PHP即有Laravel和Yii这样已经存在很多年并且备受开发者喜爱的框架和项目,同时也涌现出像Swoft这样的新框架激发着我们去研究它。2.1LaravelLaravel是一个用来构建高端web应用的基于PHP的web框架,有着优雅的语法。Laravel内置了强大的工具集,同时也提供应用的框架,它有着很多技术的特点,例如ASP.NETMVC、CodeIgniter、RubyonRails等等。而且Laravel是开源
1Keras概述在TensorFlow2.0中,Keras是一个用于构建和训练深度学习模型的高阶API。因此如果你正在使用TensorFow2.0,那么使用Keras构建深度学习模型是您的不二选择。在KerasAPI中总共有如下三大块:在Modules中有构建训练模型各种必备的组件,如激活函数activations、损失函数losses、优化器optimizers等;在Class中有Sequential和Model两个类,它们用来堆叠模型;在Functions中有Input()函数,它用来实例化张量。因此若您使用的深度学习框架是TensorFlow,而且是2.0版本,那么你就不可能不使用tensorflow.keras。这也就是使用过TensorFlow2.0版本的都在吐槽全世界都是Keras的原因。2Modules通过上面的介绍,我们知道在Modules中有activations、losses、optimizers等构建训练模型时各种必备的组件。下图就是Modules中有所的模块。下面我们详细说说里面最常见的几个模块应该如何使用。1.常用的数据集(datasets)在TensorFl
译者|Major 编辑|琥珀出品|AI科技大本营(公众号ID:rgznai100)导语:2011年,Jeopardy!挑战赛的成功,让外界看到IBM的人工智能给医学带来的革命性改变。不过,医生们对此却持观望状态。2014年,IBM为其人工智能事业部IBMWatson新成立了总部。在曼哈顿下城的玻璃塔楼内,IBM员工可以将潜在客户和来访的记者带到类似于微型天文馆的“沉浸室”。一个黑暗的空间里,参观者坐在旋转的凳子上,华丽的图形围绕着覆盖在墙上的弧形屏幕闪烁。按IBM员工的说法,这是最接近Waston电子大脑的地方。这一年,Watson的一次令人眼花缭乱的创意演示,展示了其利用人工智能改造医学的潜力——IBM首席执行官维吉尼亚·罗梅蒂(VirginiaRometty)经常称之为该公司的“登月计划”。在演示中,Watson收集了一组奇怪的患者症状,并列出了可能的诊断列表,每个列表都附Watson对诊断的置信度以及相关支持医学文献的链接。 Watson从来都让人印象深刻:它的记忆库保存着每一种罕见疾病的知识,它的处理器不易受到那种会让医生失望的认知偏见的影响。它可以在几秒钟内处理一个棘手的病案
AI科技评论按:五年前,YannLeCun等人创建了Facebook人工智能研究院(FacebookAIResearch,FAIR),试图通过开放的研究环境促进人工智能的发展,进而造福所有人——他们努力的目的是为了理解智慧的本质,以便创造真正意义上的智能机器。从那时起,FAIR便不断发展壮大、做出成果,逐渐长成一个在多个国家均设有实验室的国际性研究组织,当中包括硅谷门罗公园、纽约、巴黎、蒙特利尔、特拉维夫、西雅图、匹兹堡和伦敦。在人工智能渐渐成为Facebook业务核心的当下,FAIR也随之成为Facebook庞大人工智能架构的一部分,从基础研究到应用研究与技术开发,致力于人工智能研发的方方面面。FAIR在对外合作上秉持着开放的态度,尽可能与社会保持紧密的联动关系。他们的团队经常对外发布前沿的研究成果,并且尽可能对外开源研究代码、数据集和工具(如PyTorch、fastText、FAISS和Detectron)。他们的这些努力成功推进了人工智能研究的发展。以今年为例,来自FAIR的研究人员成功获得了多个奖项的认同,其中就包括ACL、EMNLP、CVPR和ECCV的最佳论文奖,以及ECC
量子栗发自凹非寺 量子位报道|公众号QbitAINISQ,是嘈杂中型量子(NoisyIntermediate-ScaleQuantum)的简称。今年年初,美国人JohnPreskill提出了这个概念。拥有50-100量子比特、以及高保真量子门(QuantumGate)的计算机,便可称为NISQ计算机。他相信,在不远的将来,人类就能用这样的量子计算机,踏足经典计算机无力探索的新领地。量子计算的NISQ新时代,已经到来。今年3月,谷歌宣布拥有72量子比特的芯片,刷新了IBM的纪录。谷歌的计划是,5年实现量子技术的商业化。当然,这个计划里不能只有硬件,算法也要跟上。 开源框架,为NISQ而生于是,谷歌开源了Cirq框架,这是专为NISQ算法打造的框架。Cirq主要用来短期(Near-Term)问题,希望帮助研究人员,了解NISQ计算机到底能不能解决,实际应用的中的计算问题。这个框架,经Apache2.0协议许可,可以修改,可以嵌入任何开源/付费的软件包。框架安装好之后,开发者就可以给特定的量子处理器,编写它的量子算法了,据说很友好——用户可以精确控制量子电路(QuantumCircuits)
据外媒报道,美国海军陆战队可以部署一系列未来主义的军事技术来应对“海滩突击战”。这些新技术将包括装有机枪的机器人以及变身为能深水潜行的小型隐形潜艇的快艇,以避免被敌方检测。在过去的两个星期里,美国海军和海军陆战队一直悄悄地在加利福尼亚州的彭德尔顿营举行2017年舰对岸机动开发和试验先进海上技术演习,测试了大约50种全新的技术。这次演习旨在展示和验证军方如何利用最新舰对岸技术的进步及海军舰艇和沙滩的空间。美国海军陆战队一直在尝试技术,这些技术包括水陆两用车辆、无人机及装有武器的地面机器人等。为什么添加这种新技术?鉴于全球紧张局势日益加剧,一次“海滩突击战”可能会导致巨大变化,例如第二次世界大战期间的诺曼底登陆战役。通过使用最新的先进技术,它可以帮助海军陆战队更顺利地进行海滩突击战,与以往相比,能显著降低安全风险,提高了作战效果。在这次演习中,海军陆战队一直在整合诸如机器人等技术,探索如何在未来的战争中发挥优势。无人机可以充当侦察员角色帮助收集数据,进行监视和进行侦察。配备武器的MUTT机器人另外,全新的自主战斗机器,如装有机枪的MUTT机器人,也可以提供决定性的优势。这种被称为多用途无人
3月8日,腾讯一天内同时投资斗鱼和虎牙,再现“互联网收割机”的本色。同时,映客、虎牙、快手都在谋求IPO,陌陌、YY和天鸽互动三家已经上市的公司业绩也都表现抢眼,可以明显感受到,内容产业比2017年更火,特别是短视频直播行业,真正的丰收季到来了。而这些现象体现出来的本质都是,在人人离不开智能手机的今天,具有碎片化特征的注意力经济的黄金时代正式来临。针对碎片化场景的争夺,已成为移动互联网巨头们的核心目标。什么是“碎片化”场景?在我看来候车候机就是最典型的碎片化场景:一般来说不会超过1个小时,环境嘈杂很难沉下心来做一件事情,而且中间会遇到各种播音、路人的打扰。因此用户在候车候机时用什么App,基本可以反映出各种碎片化场景中的使用习惯。日前,在移动互联网时代声名鹊起的QuestMobile发布了《春节用户洞察报告之二》,就将分析重点瞄准了春运期间用户在白云机场、北京西站等“等候”的碎片化场景,出来的结果很有意思。碎片化场景被“TBT”瓜分人们在候机、候车时最爱用什么App?可能有人的答案是视频类App,追剧;可能有人的答案是新闻App,看资讯;还有人的答案是游戏应用。总之,都是打发无聊的闲暇
学习的时候我喜欢对比,MySQL和Oracle比,Python和MySQL比,总能有一些收获,也有了新的理解。 今天整理这部分内容的时候,我发现Python和MySQL还是有很多相似之处。学习一门语言,一个数据库,字符串的处理都是一个相对重要的部分,所以我决定对比一下两者的差别。下面的演示会一边Python,一边MySQL,所以按照这个思路来看就不会感觉突兀了。转义字符 >>>print'\\' \ mysql>select'\\'; +---+ |\| +---+ |\| +---+ >>>print'\"' " mysql>select'\"'; +---+ |"| +---+ |"| +---+ >>>print'\'' ' mysql>select'\''; +---+ |'| +---+ |&
初学者如何学好Java 1、适合自己的图书才是最好的,最好的书并不一定适合你,看自己的情况。(如果你是一个Java初学者一上手就捧一本ThinkinginJava在手里,我想你的日子是不会好过的,那样的书给有一定基础的人看的,当工具书使用的,当然有一定基础后,可以跟着上边流程学,如果你能学下来,那么你的基础就不用说了) 2、看书要用心,多动脑,实践很重要,要抱着怀疑的态度看书。(再好的书也可能会出现错误,人非圣人吗!多练这个很重要,如果你光看不练,我想你连过几天会就会忘的差不多了!) 3、遇到问题多查帮助文档,还可以上网站进行搜索。(现如今的搜索引擎功能十分强大,只要你能用得到就能搜到的,还担心什么,不要碰到一点什么问题,都去烦别人,这样别人会小瞧你的!可以加一些Java交流群,对于初学者可能会有一些作用,如果你已经是高手了,我认为这样的群对你的提高不会很大)。 4、忌讳急功近利,越急就越容易走弯路。(不要急,基础虽然很简单,一个月或半年,甚至是一年,这都很正常。但出来的成效绝对是不一样的,相信你的时间不会白白浪费。) 5、我们要精而非全,语言都是相同的。学精一门语言再
在做下面方法前请先尝试重启和检查游戏完整性,检查游戏完整性方法如下,首先第一步打开库,找到csgo右键点击属性点本地文件,验证游戏完整性,看是否有文件损坏。1.打开游戏就闪退这种情况检查一下内存问题,右键我的电脑,属性,高级系统设置,高级,性能-设置,高级,虚拟内存-更改,取消最上面的自动管理,点下面的自定义大小,设置内存大小8192mb然后重启就行了,如果还是不行可以尝试下面的解决方法。2.加载游戏闪退这种情况有两个问题,第一个可能是显卡驱动问题,把现有的显卡驱动卸载在相应品牌的官网下载最新的驱动安装重启后进入游戏就好了,第二个可能是网络问题,目前最流行的方法就是下载腾讯加速器,右上角设置点LSP修复,重启再进入游戏就好了。3.检查游戏环境win+R快捷键运行框中输入dxdiag查看是否正常,不正常百度下载修复工具。4.检查电脑C++等游戏环境是否安装完整这种情况可以直接重新下载安装,推荐方式在腾讯电脑管家软件管理里面搜索游戏环境程序集合傻瓜安装包下载并安装就可以了。5.网络配置问题win+R快捷键打开CMD面板,依次输入以下命令重置配置。输入netshadvfirewallrese
前言 标准IO库自1975年诞生以来,至今接近50年了,令人惊讶的是,这期间只对它做了非常小的修改。除了耳熟能详的printf/scanf,回过头来对它做个全方位的审视,看看到底优秀在哪里。 打开关闭 要想使用IO流就必需打开它们。三个例外是标准输入stdin、标准输出stdout、标准错误stderr,它们在进入main时就准备好了,可以直接使用,与之对应的文件描述符分别是STDIN_FILENO/STDOUT_FILENO/STDERR_FILENO。除此之外的流需要打开才能使用: FILE*fopen(constchar*restrictpath,constchar*restrictmode); FILE*fdopen(intfildes,constchar*mode); FILE*freopen(constchar*path,constchar*mode,FILE*stream); FILE*fmemopen(void*restrict*buf,size_tsize,constchar*restrictmode);复制 fopen用于打开指定的文件作为流 fdopen用于打开
【模板】轻重链剖分/树链剖分 题目描述 如题,已知一棵包含\(N\)个结点的树(连通且无环),每个节点上包含一个数值,需要支持以下操作: 1xyz,表示将树从\(x\)到\(y\)结点最短路径上所有节点的值都加上\(z\)。 2xy,表示求树从\(x\)到\(y\)结点最短路径上所有节点的值之和。 3xz,表示将以\(x\)为根节点的子树内所有节点值都加上\(z\)。 4x表示求以\(x\)为根节点的子树内所有节点值之和 输入格式 第一行包含\(4\)个正整数\(N,M,R,P\),分别表示树的结点个数、操作个数、根节点序号和取模数(即所有的输出结果均对此取模)。 接下来一行包含\(N\)个非负整数,分别依次表示各个节点上初始的数值。 接下来\(N-1\)行每行包含两个整数\(x,y\),表示点\(x\)和点\(y\)之间连有一条边(保证无环且连通)。 接下来\(M\)行每行包含若干个正整数,每行表示一个操作。 输出格式 输出包含若干行,分别依次表示每个操作\(2\)或操作\(4\)所得的结果(对\(P\)取模)。 样例#1 样例输入#1 55224 73780 1
ShoppingOffers 在商店中,每一种商品都有一个价格(用整数表示)。例如,一朵花的价格是2zorkmids(z),而一个花瓶的价格是5z。为了吸引更多的顾客,商店举行了促销活动。 促销活动把一个或多个商品组合起来降价销售,例如: 三朵花的价格是5z而不是6z,两个花瓶和一朵花的价格是10z而不是12z。编写一个程序,计算顾客购买一定商品的花费,尽量利用优惠使花费最少。尽管有时候添加其他商品可以获得更少的花费,但是你不能这么做。 对于上面的商品信息,购买三朵花和两个花瓶的最少花费的方案是:以优惠价购买两个花瓶和一朵花(10z),以原价购买两朵花(4z)。 [编辑]格式 PROGRAMNAME:shopping INPUTFORMAT: (fileshopping.in) 输入文件包括一些商店提供的优惠信息,接着是购物清单。(最多有5种商品) 第一行优惠方案的种类数(0<=s<=99)。 第二行..第s+1行每一行都用几个整数来表示一种优惠方式。第一个整数n(1<=n<=5),表示这种优惠方式由n种商品组成。
昨天在做存储迁移的时候,对ASM磁盘组的东西进行操作时,出现了如标题的错误。经查资料,发现原因如下: 如磁盘组是使用asmca图形化工具创建,则compatible.asm默认设置就已经为11.2,如使用CREATEDISKGROUP这个SQL命令创建,则默认设置为10.1,需要手动修改。因此,需要先手工进行设置版本,指令如下: SQL>alterdiskgrouporadgsetattribute'COMPATIBLE.ASM'='11.2'; -------------------------------------------- 快乐地度过每一天,踏实、认真地做好每一件事。
前后端分离已经是老生常谈的话题了,甚至再谈前后端分离显得比较落伍。之所以想谈谈前后端分离,是因为在这种分工模式下实实在在的遇到了一些问题。这篇文章希望对前后端分离做一个简单的梳理。 尽管前后端的分离已经不再新颖,但仍然有很大一部分企业由于历史的原因,采用的是“传统”的Web开发模式,即前端人员根据UI做好HTML页面,再将HTML页面交给后端开发人员打通数据和调试。这是最为“原始”的方式,甚至有可能在如今的大学课堂中仍然是这样的教学方式。我想前端开发人员被“鄙视”也即是这样的开发模式所导致,因为前端几乎不做任何的调试,可能只是调整下页面的一些工作。这样的开发模式也很简单,看起来是对后端开发人员要求更高,也就是要求后端开发人员掌握一定的前端基础。 但随着前端的发展,一些年轻的公司或者年轻的项目也早已对前后端分离进行了实践,前端不再只写HTML页面,后端也不需要掌握前端JavaScript基础。因为在前后端分离的开发模式下,前端和后端被实实在在的所隔离,后端代码中不再将前端代码写到工程中,前端和后端只专注自己的领域,这样的开发模式但也带来了很多的问题。 后端开发人员不再参与到前端的开发
响应数据的返回 在WSGIHandler.__call__(self,environ,start_response)方法调用了 WSGIHandler.get_response()方法,由此得到响应数据对象response.如今所要做的,便是将其返回给客户端.在 Django源码小剖:初探WSGI 中, 简要的概括了请求到来时django自带服务器的执行关系,摘抄如下: make_server()中WSGIServer类已经作为服务器类,负责接收请求,调用application的处理,返回相应; WSGIRequestHandler作为请求处理类,并已经配置在WSGIServer中; 接着还设置了WSGIServer.application属性(set_app(app)); 返回server实例. 接着打开浏览器,即发起请求.服务器实例WSGIServerhttpd调用自身handle_request()函数处理请求.handle_request()的工作流程如下:请求-->WSGIServer收到-->调用WSGIServer.
课程大纲 获取语料 预处理 特征工程 模型介绍 评测标准 项目介绍 01获取语料 数据集 语料是NLP的生命之源 所有的NLP问题都是从语料中学到数据分布的规律 语料的分类 单语料 平行语料 复杂结构 类型 说明 例子 单语料 只有句子和句子集合 整理好的英文文档,中文古诗数据集 平行语料 有句子和句子之间的1vs1对应关系 中英文翻译数据集,对话数据集 其它 复杂的结构 知乎的回答和评论数据 数据集与语料 概述 英文语言模型语料总结 http://nlpprogress.com/english/language_modeling.html 语料例子 PennTreebank(PTB) DailyDialog WMT-1x翻译数据集 中文闲聊数据集 中国古诗数据集 获取方法 公开数据集 爬虫 社交工具埋点 数据库 PennTreebank NLP中常用的PTB语料库,全名PennTreebank。 PennTreebank是一个项目的名称,项目目的是