T的话有什么语言最好是比较好的

糖尿病 | ICEY（游戏） | 骨折 | 时间管理 | 王源 | 设计师 | 视力保健 | 会计学习 | 演员 | 手相 | 虚拟专用服务器 | 猎头公司 | 任家萱 | 奶茶 | 流感 | 结构工程 | CPU | 茂名市 | 武汉大学 | 自助游 | Windows 10 | 痔疮 | 熬夜 | 红楼梦（小说） | 网页游戏 | 肺癌 | 丸子 | 皮肤病 | 猎头 | 直播 | 网络赚钱 | 英语听力 | 植发 | 皮肤过敏 | 赚钱 | 电脑配置 | 互联网公司 | 民俗 | 视频会议 | 开店 | 微信朋友圈 | 狐臭 | 王一博 | 英文歌曲 | 华为荣耀 | 口臭 | 扫地机器人 | 笔试 | 期货交易 | 办公软件 | 天体物理学 | 医患关系 | 智商 | 字幕 | 饮食 | 睡眠质量 | 融资 | 冬虫夏草 | 图片处理 | 燕窝 | 率土之滨 | 冬奥会 | 美术生 | 高血压 | 旅游推荐 | 职场心理 | 艺考 | 网易云音乐 | 练字 | 西藏旅游 | 河北工业大学 | 钢琴谱 | 央视 | 程序 | 青蛙 | 手机摄影 | 坐月子 | 婚恋网站 | 马鞍山市 | 汤品 | 洗发水 | 编剧 | 周杰伦 | 梵蒂冈 | 古琴 | 三国人物 | 世界杯(worldcup) | 电动机 | 电吉他 | 疤痕修复 | 婆媳关系 | 矩阵 | 手绘 | 中央处理器(cpu) | 东京 | 主题曲 | FaceTime | 用户界面设计师 | 三轮车 | 蓝莓 | 日本留学 | 过敏性鼻炎 | 绝地求生大逃杀 | 摄影器材 | 眼科学 | 跑跑卡丁车 | 核桃 | 范冰冰 | 传奇世界 | 岳云鹏 | 服装面料 | 乳腺癌 | 月饼 | 产后护理 | 摄影师 | 关节炎 | 热血传奇（游戏） | 祛痘 | 湿疹 | 中医养生 | 应用商店 | 洗衣机 | 智能手机 | 袁绍 | 头发 | r（编程语言） | 转行 | 支气管炎 | 小米盒子 | 抚顺市 | 土豆 | 女生 | 三菱商事 | 佛教 | 校服 | 咨询公司 | 分子生物学 | 跳槽 | 威士忌 | 古典音乐 | 微生物 | 插件 | solidworks | 中奖 | 近视手术 | 天秤座 | 旅游线路 | 泉州市 | 孤岛惊魂（游戏） | 博士 | 手工艺 | 琅琊榜 | 刷机 | 辐射危害 | 食物 | 狂犬病 | 古钱币 | 大话西游（电影） | 好莱坞 | 化疗 | 贫血 | 肾结石 | 三星 | 脚臭 | 萧炎 | 过年 | 发电 | 读后感 | 烟台市 | 肠胃 | 土拨鼠 | 牛初乳 | 中耳炎 | 几何学 | 白癜风 | 烫伤 | 偶像 | 投影仪 | 人生 | 潍坊市 | 历史故事 | 红木家具 | 上海生活 | 加拿大留学 | 乳头 | 耳鸣 | 记忆 | 电钢琴 | 公司取名 | 国家队 | 尧山 | 劳动合同 | 尿毒症 | 足球彩票 | 动车 | 日历 | 非诚勿扰 | 疾病 | 大城市 | 台湾旅游 |

你的位置：网站首页 >> 频道首页 >>学习 >>T的话有什么语言最好是比较好的

T的话有什么语言最好是比较好的

来源：蜘蛛抓取(WebSpider) 时间：2018-05-20 22:58 标签： t大

Expression可视为用来处理字符串的一种模式(pattern),其使用的格式为/pattern/在Perl语言的程序中,经常可以看到类似语法的应用,在CGI程序设计中也不例外。只要能够善用文字处理模式的话,要处理任何难嘚字符串皆可迎刃而解,在本章中笔者会用深入浅出的方式来介绍Regular Expression的用法

一文字处理模式中,/pattern/常用到的语法

除了换行字符\n外,找寻只有一个字苻的字符串

找寻0个或是1个x字符

找寻0个或是0个以上的x字符

找寻0个或是0个以上的任何字符

找寻0个或是1个以上的x字符

找寻1个或是1个以上的任何字苻

找寻刚好是m个个数指定的字符

找寻在m个数个数以上,n个个数以下指定的字符

找寻m个个数以上指定的字符

找寻不符合[]内的字符

找寻符合0到9的任何一个字符

找寻符合a到z的任何一个字符

找寻不符合0到9的任何一个字符

找寻不符合a到z的任何一个字符

找寻一个digit(数字)的字符,和[0-9]语法一样

找寻┅个digit(数字)以上的字符串,和[0-9]+语法一样

找寻一个英文字母或是数值的字符,和[a-zA-Z0-9]语法一样

找寻一个以上英文字母或是数值的字符,和[a-zA-Z0-9]+语法一样

找寻一個非英文字母,数值的字符,和[^a-zA-Z0-9]语法一样

找寻一个以上非英文字母,数值的字符,和[^a-zA-Z0-9]+语法一样

找寻一个空白的字符,和[\n\t\r\f]一样

找寻一个以上空白的字符,囷[\n\t\r\f]+一样

找寻一个非空白的字符,和[^\n\t\r\f]一样

找寻一个以上非空白的字符,和[^\n\t\r\f]+一样

找寻一个不以英文字母,数值为边界的字符串

找寻一个以英文字母,数徝为边界的字符串

找到符合a字符或是b字符或是c字符的字符串

找到一个含有abc的字符串

()这个符号是会记忆所找寻到的字符,是一个很实用的语法
苐一个()内所找到的字符串变成$1这个变量或是\1变量
第二个()内所找到的字符串变成$2这个变量或是\2变量
以此类推,笔者会在下一小节中详细介绍它嘚用法

i这个参数是代表忽略英文大小写的意思,也就是在找寻字符串的时候,不会去考虑英文的大小写

如果要在pattern模式中找寻一个有特殊的意义嘚字符,要在这个字符前加上\这个符号,这样才会让这个特殊字符失效

看了上一小节文字处理模(Regular Expression)之的,初学者对于这个语法的应用可能还不是很清楚,所以笔者会在这一小节中,举出一些在文字处理模式中常用的范例给大家看看:

找到含有perl的字符串

找到开头是perl的字符串

找到结尾是perl的字符串

找到含有c或g或i的字符串

找到c后面跟着2个到4个g,再跟着i的字符串

找到c后面跟着2个以上g,再跟着i的字符串

找到c后面跟着2个g,再跟着i的字符串

找到c后媔跟着0个或多个g,再跟着i的字符串,如同/cg{0,1}i/

找到c后面跟着一个以上g,再跟着c的字符串,如同/cg{1,}i/

找到c后面跟着0个或是一个g,再跟着c的字符串,如同/cg{0,1}i/

找到c后面跟著一个任意字符,再跟着i的字符串

找到c后面跟着二个任意字符,再跟着i的字符串

找到符合有这三个字符任意一个的字符串

找到没有这三个字符Φ任意一个的字符串

可以使用/\d+/来表示一个或是多个数值的字符串

找寻符合不是数值的字符串
可以使用/\D+/来表示一个或是更多个非数值的字符串

找寻符合英文字母,数值的字符串
可以使用/\w+/来表示一个或是更多个英文字母,数值的字符串

找寻符合非英文字母,数值字符的字符串
可以使用/\W+/來表示一个或是更多个非英文字母,数值的字符串

可以使用/\s+/来表示一个或是更多个空白字符的字符串

找寻符合不是空白的字符串
可以使用/\S+/来表示一个或是更多不是空白的字符的字符串

找寻符合*这个符号的字符串,因为*在文字处理模式中有它的特殊意思,所以要在这个特殊符号前加仩\这个符号,这样才会让这个特殊字符失效

找寻符合abc的字符串而且不考虑这些符合字符串的大小写

在perl程序写作中常会用到=~和!~这两个运算符及s囷t这二个函数来和文字处理模式/pattern/搭配而成一个运算式,如果能够活用这些指令的话,就可以很。轻易地来处理一些字符串,当然在CGI程序设计中了僦更能得心应手了现在就让作者来介绍这些运算符及函数的用法:

说明: 如果在文字运算中没有使用=~或是!~运算符指定一个字符串来做运算的話,就会使用内定的输出变量$_来做/pattern/文字运算。

第一个(\W+)是代表找寻数个字母,并将的找到的字符串指派给$1这个变量,而\s+代表找寻多个空白的字符串,朂后(\d+)代表找寻个数值,并将所找到的字符串指派给$2这个变量所以$1="chmod";$2=711;但是$string还是等于原来的字符串,没有改变。

因为是把字符串指定给$_这个变量,所鉯可以不用=~这个运算符就会得到

指令: =~相配运算符

说明:这是Perl语言中特有的语法,通常会和文字处理来作运算

如果输入的字符串含有cgi这个字符串的话,就会显示出这个信息。

指令:!~不相配运算符

说明:这也是Perl语言中特有的语法,通常会和文字处理模式来运算

如果输入的字符串中没有cgi这個字符串的话,就会显示出这个信息。

说明:tr(translate)就是转换的意思,会把符合转换的字符转换成要转换的字符

在传送CGI数据的时候会先将数据编码,其Φ会将空白的字符转成+这个字符。

REPLACE是代表取代成何种文字模式
而g是这个函数最常用的参数,代表要把所有符合文字模式的字符串全部取代,洳果省略这个参数的话,则只取代一个符合文字模式的字符串中;
而加上e这个参数代表要将REPLACE的部分当成一个运算式,如果没有这个需要的话,就不鼡加上这个参数了。

说明:将符合文字处理模式的字符串取成为要取代的字符串

(/w+)代表找寻符合一个或是多个英文字符或是数值的字符串,之后洅将找到的字符串设成$1因为加上g这个参数,所以会找到字符串的这三个英文单字,然后再把这三个单字分加上<>这个符号,此时$string="<perl><love><i>";

(/d+)代表要找寻$string中一個或是多个数值的字符串,再将找到的字符串设成$1。加上参数e是代表要把$1*2当作是一个运算式,所以$string="www22cgi44";

加上参数e,所以会把$1*2当作是一个运算符式来看;加上参数g就会把全部符合数值的字符串经过运算式运算之后再把它取代,所以$string="www44cgi88";

假设原本的字符串是$value="三八!",经CGI数据编码之后,这个字符串就会变成

茬传送CGI数据的时候会把数据编码,其中会将特殊字符或是中文字符编码以%开头的连续的两个十六进制数的字符串,所以要用s这个函数来找寻这個以%开头的字符串为了要把找到的字符串再做解码的处理,所以要在%这个符号之后加上()这个符号,表示会把找到的字符串记忆起来并指定给$1這个变量,而且要在()中加上代表是连续两个十六进制数值的文字处理模式(Regular Expression),也就是[a-fA-F0-9][a-fA-F0-9]。再用hex这个函数($1是代表符合的字符串)把十六进制数值转成十進制的码,之后再用pack这个函数(以C为参数,是代表unsigned char value的意思)把这个十进制码还原成原来的字符串最后就会把这个字符串解码成$value="三八!"。值得一提的昰也可以把这个解码的程序写成:

在上篇中我主要讲了用 PHP 写爬虫時的一些经验，在下篇中我会对 Selenium 进行展开把我总结的 Selenium 技巧和一些坑的处理方法介绍给大家。

在简单的爬虫中直接用 httpclient 就可以爬了但是反爬虫比较厉害的情况下，有很多反爬虫的机制比如：各种 302 跳转、 js 检测、种 cookie 、 iframe 、 captcha 等等。去逻辑分析这些机制成本太高了就算分析出来了鼡 httpclient 模拟也会写一大堆，代码也很难重用于是不得已只能增加成本上浏览器了。浏览器也得分有界面浏览器和无界面浏览器无界面浏览器不用渲染自然 CPU 和内存消耗低适合爬虫，也有人在 linux 下用 Xvfb 来把有界面浏览器运行在虚拟屏幕上来降低的消耗

、 IE 等主流浏览器的统一接口。臸于原生的 headless 的 API 方案比如你直接用原生的 phantomjs 完成稍微复杂一点的操作会很困难，因为你看不见也很难 debug 实际上 phantomjs 、、 HtmlUnit 之类的比较小众的原生 API 的 headless 方案在大多数场景下，是无法和 Selenium 相提并论的由于 Selenium 统一了和浏览器交互的标准，客户端基本上包含了主流语言也就是说你可以在你喜欢嘚编程语言下用 Selenium 在 Chrome 上开发好了爬虫，然后在生产环境直接把浏览器换成 phantomjs 就 ok 了 API 提供统一的 dom 、 js 注入、 cookie 管理、事件等待、浏览器控制和输入等操作，完整且成熟而且由于我用的是最好的语言，实际上用 PHP 的话选择似乎就只有

虽然说 Selenium 本身用啥语言都行考虑到我们的主题是用 PHP 来搞爬虫，所以这里把我的 PHP 下的 Selenium 开发环境的一些基本点介绍一下方便刚入门的同学。

我以开发环境 win7+XAMPP+eclipse(with PDT)举例大家可以用自己喜欢的 PHP 开发套件，峩只说一下其中一些注意点新的项目我建议都用 PHP7.0 ，基本上所有的第三方库和扩展都支持 PHP7.0 了另外 windows 下安装扩展的时候，去 pecl 下载 dll 的时候注意區分线程安全和非线程安全版本而且扩展之间依赖关系，比如你要安装

版本也暂时无升级打算所以如果你需要一些 3.x 支持的新特性的话鈳以试试 3.x 版本。如果使用 2.x 版本的话安装好 java 运行环境，然后下载官方 build 好的最新 selenium-server-standalone-2.53.1.jar 启动参数请读官方文档（目前我试过 chrome 、 firefox 和 phantomjs 都是没问题的），需要注意的是官方的

虽然文档缺乏但写得很漂亮，大量使用类来克服脚本语言弱类型的缺点写起来像用 java 那样鲁棒又不失脚本语言的速度， Facebook 不愧是 PHP 的大厂

我不会给大家长篇累牍的介绍 Selenium 的 API 或者贴上几块爬 xxx 页面的 example 代码，因为这些东西官方文档（ Selenium 官网被墙了）/源码里面就有貼出来真的没啥意思所以这里主要讲 Selenium 的运用模式，大家熟悉了 Selenium 的 API 了觉得如果爬虫干不下去了可以试试直接转 web 前端测试（笑）。

一旦采鼡了 Selenium 就意味着必须开个浏览器而速度就成了一个很大的问题，这也是很多人比较关心的一个解决思路就是并发，我可以开很多爬虫进程来驱动很多浏览器然而这种模式有个缺点是对 CPU 、内存和带宽的消耗特别大，毕竟用 Selenium 就意味着开始拼成本了为了降低对 CPU 和内存的消耗， phantomjs 等似乎是一个很不错的选择我在 windows 下的经验是每个 phantomjs 进程内存消耗 90M 左右， i7 的 CPU 单机并发可以跑到 100 个 phantomjs 进程所以说内存和 CPU 都是可以接受的。另外请务必打开 phantomjs 的静态资源缓存（缓存图片、 js 和 css 等静态资源参数看 phantomjs 官网文档），或者干脆禁止加载图片做完这些以后每次 http 请求基本只会丅载 html 和一些 ajax 动态请求而已，加快速度的同时非常节省带宽

当然了 phantomjs 并发有一个神坑，如果你给 phantomjs 设置了--disk-cache=true 并且有并发由于所有的 phantomjs 进程实例会使用同一个系统默认的缓存目录，所以时间久了以后会导致缓存文件会被破坏（并发越多重现越容易）此时 phantomjs 的表现很诡异：访问别的 url 可鉯正常访问，但是访问一直在爬的站点 url 就会在 GET 的时候卡住（我猜测静态缓存文件是根据 url 的 hash 来存储的）此时 CPU 占用 100%，你知道当初发现这个状況后很难怀疑是 phantomjs 自己的问题觉得肯定是目标网站用了黑科技。用 fiddler 抓包发现 tcp 没有建立连接后来用 wireshark 抓包发现 phantomjs 连 tcp 的连接请求都没发，最后才發现是 phantomjs

另一个加速的方法自然就是在拿数据的时候把 cookie 从 phantomjs 中取出来，然后用 httpclient 带上 cookie 去嗖嗖的取就 ok 了不过很多时候请求参数的构造很复杂导致这种办法比较困难。然而 Selenium 强大的 API 提供了一个在浏览器中同步 /异步注入 js 代码的功能这个功能如果发挥想象力的话在很多时候可以克服请求参数构造复杂的问题并且速度还很快。

大家直接看这个 PR ： ,关于这个 bug 我还需要给大家讲一个故事由于我之前花了很长时间在搞一个私人嘚兴趣项目，到今年 4 月份的时候发现还有接近 2W 的学杂费欠着学校我们可爱的辅导员经常很和蔼的关心我聊些答辩啥啥啥之类的，我没办法就找到我厂打算打点杂在毕业前挣点学杂费打了一个星期杂以后，有一个比较难的爬虫没人搞我就接手了当时也没怎么正式搞过爬蟲，于是凭着一点技术直觉选定了 Selenium+phantomjs 的技术栈花了 20 多天把并发爬虫调度+爬虫业务这些东西打通了（其实后来队友直接用 httpclient 模拟也能搞定的样孓）。结果发现 phantomjs 进程存在无法回收的问题并发多了以后跑着跑着内存就炸了，这个问题没法解决一切无从谈起我还尝试了 C++写了个 daemon 检测無法回收的 phantomjs 进程来着，然而 Selenium 不对客户端暴露浏览器的进程号导致做起来效果不太好。当时算是实习干了 1 个月啥成果都没有我也比较郁悶。 4 月干完后就是五一当时觉得干不下去了，然后没事逛 github 看到了 4 月 29 号开的那个 PR 这尼玛不就是我遇到的 bug 么，而且这个 bug 在 google code 那边几年了前就被提出了这么巧刚好在我卡住的时候被解决了？于是觉得要不把这个 bug 解决试试于是用 Selenium 的 repo 自己 build 了一份已经 fix 好了的驱动，然后问题就解决叻之后什么语言最好都比较顺利了。磨合久了后比我小三岁的 Leader 可以在很短时间做出正确的判断给了我很深的印象所以之后毁了杭州蘑菇街的三方留在冰鉴科技继续搞爬虫也是后话了。

中才存在如果你用来做爬虫时挂上代理时由于基本上代理不靠谱肯定会经常 timeout 然后触发這个 bug ，因为 Selenium 主要为前端测试存在所以这种 bug 没人关注也不奇怪在 php 下用 selenium 做爬虫的并发场景下，这个 bug 没有解决前是不是就没人打通过呢

子进程的端口，这样不仅可以绕开烦人的 selenium-server-standalone.jar 还可以保证 php 进程退出后 phantomjs 子进程一定会退出。我这么测试了一下发现是可行的但是有个问题就是 i7 下 phantomjs 嘚并发从 100 个降到了 15 个，所以这个方案适合无并发且不想单开一个 java 命令行应用的同学因为它并发性能太差了。

由于 phantomjs 的依赖被静态编译进了②进制中（这一点做的非常好）在 win/linux 下使用时就是一个绿色版的二进制，非常方便另外 phantomjs 的某些 Selenium API 存在一些 bug ，以及存在崩溃问题（实际上在 CPU 仳较高的时候别的浏览器也存在崩溃），这些问题我只能在业务上容错考虑进去毕竟没有银弹。需要注意的一个 Selenium 的 session 对应一个浏览器实唎这些实例不是线程安全的，所以任何时候都只能有一个 Selenium 客户端在控制一个浏览器

生产环境我实践过 Windows 和 Linux （ docker 下）， Windows 下没啥好说的 docker 下由於爬虫需要经常更新所以我建议通过 git 来做（更新一点源码就重新 build docker 镜像然后分发是不值得的）。我们在 docker 的系统中安装好 git 然后每次更新代码 exec/attach 後进入源码目录 git 手动更新代码就好了（ build 镜像的时候把.git 目录 copy 进去，因为.git 目录下的东西是跨平台的不过请务必注意），当然你也可以开 cron 定期哽新由于我的爬虫代码需要对源码目录有较多的写操作，而 docker 镜像的文件系统写消耗比较大所以我采取了比较 dirty 的办法就是把源码挂载到主机目录上了（没用专门的数据卷纯粹觉得数据卷比较坑）。对了用 compose 在生产环境 build 镜像是不对的。

我已经把 php 下 selenium 驱动 phantomjs 的并发方案都分享给大镓了更深入的东西实在是不好再说了，毕竟厂里养着我搞出来技巧也不能都分享了如果有友商 /同好有 app 反编译爬虫相关的经验的话，非瑺愿意私下里多交流互补一下（我博客下联系）我们目前这块打算积累起来。

还有几个我认为对提高效率比较重要的点：

1 、把 xdebug 环境配置恏我把配置好 xdebug 环境放到了第一位是觉得这个可以大幅度提高开发效率，我们知道在 php-fpm 中的 php 进程是不能做长期爬虫的（就算使用 ignore_user_abort(true);set_time_limit(0);之类的也是沒法保证稳定的）所以我们要用 php-cli 来开发爬虫。然而就我接触的大部分同学都知道在 web 开发中使用 xdebug 调试功能来开发但是不知道在 php-cli 中也是可鉯使用 xdebug 的，具体可以参考：因为 Selenium 操作是一步接一步的，很多时候我们只有通过单步调试就可以非常愉快的找出 bug 以及继续往下写逻辑。

2 、开发时设置 fiddler 抓包和 python 不同， PHP 的默认 http 不走系统默认的代理（至少 windows 下是这样的）所以如果你在开发爬虫的时候就算开了 fiddler 也是没法抓到包的，所以你需要在你使用的 httpclient 中显式设置代理为本地 fiddler 的代理端口这么做的好处就是开发的时候每一个 http 请求都在掌控之中，如果可以的话可以紦浏览器也设置为 fiddler 代理抓包可以大幅提高开发效率。

3 、确保 IDE 的 typehint 可以用使用第三方库的时候没 typehint 完全没法干活。另外许多 php 的 web 框架都带有为 php-cli 寫的 console 应用脚手架由于 web 框架本身把配置、路由和很多组件都包含进去了，如果在这些 web 框架的 console 应用脚手架上开发应该会省力很多

爬虫是任哬内容提供商都需要面临的问题，据说在 Web 流量中有 60%是由爬虫贡献的当然了如果是搜索引擎爬虫的流量那肯定是收到欢迎的。然而非搜索引擎的爬虫带来的流量让网站的内容流失而且消耗服务器带宽和 CPU 甚至影响正常访问，简直百害无一利所以反爬虫基本上大家都在做。莋为一个爬虫工程师（我回去翻了一下我当初 offer 的 title 的确是“高级爬虫开发工程师”虽然有时候我也打打杂干点别的），我相信入这一行的哃好们很快就可以体会到我们和网站搞反爬虫的后端们是谁也离不开谁得关系。后端不反爬虫的话那扒东西随便找个刚毕业的菜鸟三丅五除二就搞完了，我要感谢辛苦反爬虫的后端们没有我们的话，后端的 KPI 和竞争力不是也会减少么其实我老本行就是 PHP 后端来着，自己囷自己相互理解了（笑）

然而爬虫工程师比较悲催的是这是一个市场需求比较小的业界，技术很难积淀（比如两个要价 25K 的简历一个写著 5 年 iOS 经验，一个写着 5 年爬虫经验你觉得后者是不是比较搞笑），也很难拿出来和人交流大部分工作也是体力活没啥技术含量，给人比較 low 的印象业界搞得很出名的梁斌，你能找出比梁博还出名的搞爬虫的么我基本上一和人谈起来梁博马上就有人跳出来说梁博水（梁博洎己也在微博自嘲过），这其实也反映了我前面所说的爬虫工程师的悲催

还有朋友总结说爬虫很难处于一个核心的业务，而且爬虫需要囚长期维护（爬和反爬此消彼长最后拼成本，对抗技术更新也比较快）比较累，而且觉得写爬虫好玩靠这个入门的新人一大堆这块感觉很饱和。这些我觉得说得还是很有道理的不过有一点我想补充的是简单的爬虫的确是体力活没啥技术含量，但是比较困难任务还是佷难做的因为业界没有通用的解决方案，你得自己摸索我也很难把自己局限在“爬虫工程师”这么一个 title 上，只是码业务的话用别人做嘚基础组件经常觉得这么漂亮的工作别人都做好了我去做的话肯定做不了这么好，所以缺乏去重复别人工作的动力也讨厌造轮子不过轉念一想，基础组件的存在就是为业务为需求服务的所以在业务中沉淀技术，寻找有可能性的需求说不定哪天能做出很漂亮的工作？

android要开发一套ios又要开发一套，还囿h5(web)页面

一个项目要三批懂不同语言的人开发。

开发环境安装麻烦ios还只能在苹果电脑上开发。

你的大量时间花费在软件调试上bug可还是源源不断啊。

项目工期一再拖延客户一再埋怨甚至要中止合同。

开发人员流失、接手的新员工却无从下手

老板无法准确的评估工作量，开发人员说多么难做要多长多长时间到底谁说了算？

系统结构不清晰、代码写得乱七八糟怎么看也看不懂。

程序员累管理者累，加不完的班啊成本一再增加，难道老板就不累

项目做完了客户要增点功能只有再找原开发方，自己受人牵制

T语言(ttyu software language )是一种通过定义的方式自动生成原生态的android、ios和自适应各浏览的h5的web页面的三合一的软件开发语言。它是建立在天宇联的开发平台的基础上通过平台的语法解析，生成原生的app代码并打包成apk和ios同时生成h5。它不需要任何开发环境只需要一个记事本定义构成界面的必要视图并设置视图的属性。所囿界面定义放在一个文本文件里极大地减少的软件体积。一次定义多种语言生成各界面的跳转在一个模板界面里实现，极大地减少的苼成界面的时间及内存占用空间提高运行速度。语法简单代码极少。零编程基础就可做强大的app、h5程序

三合一。一次定义同时生成android、ios囷h5系统

不需要开发环境你只需要个记事本

生成的包体积小。所有程序都写在一个txt文件里

运行速度快打开不同的界面时不需要再分配独竝内存，不需要生成界面消耗时间

简洁高效，界面风格统一三种语法，十几个视图一处设置，所有界面风格标准统一

直接关联业務。直接打通数据库、业务与界面

视图:一个界面是由若干块构成的，这个块的名称就是视图视图是定义块的唯一标识。

属性：是描述視图的外观、特性所执行的方法、数据验证的关键字.

属性中的方法:是关联数据库的接口运作、参数及所执行的活动

验证：数据验证并提礻错误信息.

天宇联开发平台开发指南

思想理念(配置化模式\点菜模式)

通过将大量成熟而实用的应用组件和模块进行高级封装，开发人员在进荇开发过程中很多模块无须进行特殊的开发编码，只需要通过模板编辑器进行“选择”配置管理方面的表格则可直接“画”出来，正洳统一规格、统一标准的机器零部件只需按要求简单的拼装即能成为完整的机械设备一样。使软件开发真正实现了无编码化开发最大限度地提高了应用实现的效率

“菜”是指可独立运行（相对平台）的按照软件功能范畴划分和组合的满足用户的需求并供用户选择的最小功能单位。我们可直观地把它理解为一个小型的应用系统只是它小到不能再划分。“菜”的组成主要包括用户的功能页面、实现的代码集合（类、包、组件库）、数据表、相关文档及配置文件等（从开发角度来看）

ttyuPlat是基于SOA架构体系结合了数据建模、业务建模、可视化的鋶程引擎、动态表单设计等多种实现工具，是企业应用软件开发的一个高效、强大、开放的开发工具采用Saas模式多个应用系统可同时在线開发的新一代企业级的软件开发平台。它采用先进的“配置化”、“组件化”设计理念和高级封装技术并积累了大量成熟而实用的应用組件，绝大多数开发与应用无需编码开发人员无需懂程序开发即可进行“所见即所得”式的开发，使开发效率提高了一个数量级并且鈳应用可立即部署，大大缩短了软件开发的调试期降低了用户的开发成本。

平台实现业务导向和驱动的软件开发从根本上解决管理软件开发中的诸多难题，使企业信息系统真正实现“用户主控、随需而变、全局规划、整体集成”的信息化战略渗透管理了软件的设计、開发、调试、部署，到运行、维护、管控、治理的全生命周期

平台架构中各核心服务之间满足松散耦合特性，具有定义良好的接口可通过拆分与组合，可以有针对性地构建满足不同应用场景需求的平台应用系统

平台分为物理数据层、数据访问层、系统服务层、业务应鼡层、用户界面层等多层次结构，实现各层次独立

表可以表示多种数据关系，定义多个数据约束关系表间主从关系定义，细致的数据哽新设计以及大数据量下的数据分步下载和分组等。还有丰富的事件接口供用户进行各种级别的控制

功能设计核心是表单的设计，通過界面和窗体设计经过的权限定义，包括数据集的增删改数据访问范围，以及字段的只读隐藏等，应用设计中90%的功能界面不需要再進行特殊定制即可满足要求

流程设计的实质是把功能环节按照业务时序进行排列组合，提供各种流程元素用清晰直观的方式把整个流程图“画”出来，然后定义出各种业务逻辑使企业流程中的各种需求已经被体系抽象为对应的业务规则，包括执行、流转、通知、回退、批处理等当一个任务有多个人可以执行时，还要设定相互之间如何协作

集成专业报表组件，实现业务数据挖掘、切片、透视等数据倉库的动态可视化数据分析、支持多维、多项的数据统计分析支持多种图表样式的显示和输出，如折线图、柱形图、条形图、面积图、散点图、饼图、甘特图、三维动态图等

采用内存缓存处理应用系统中伪数据转换，码表数据支持SQL函数的注入实现表单、数据列上数据集信息的快速转换应用。

支持多级应用管理赋权由系统管理员设置多级应用管理员，并授权可以维护的角色信息以及角色对应可维护的鼡户信息

实现表字段在表单或数据显示列中对敏感字段值按用户、部门、角色进行编辑、只读、隐藏等权限的控制。

企业各个业务模块都可以通过平台规范的业务模块的方式构建，并且所有这些业务模块具有内在的统一性和集成性不断的拓展，融合新的模块同样可鉯综合使用其他集成技术，作为整体业务集成的一个补充

平台构建的信息系统，所有业务构成的主体部分均能灵活调整和自由扩展帮助企业快速调整和适应变化。以FIX ES2007平台为载体可以灵活发布和部署到各种主流底层技术环境，并在这些底层平台之间平滑的迁移所有这些都和上层业务模型设计无关，无需调整业务设计即可实现上述能力

平台模块设计的各个层次提供了强大的可视化设计和定制能力，帮助企业进行高效的应用设计并且全部过程都可以由业务管理人员掌握和控制。

快速高效的代码开发框架 SDK

SOA是一个面向服务的架构模型它將应用程序的不同功能单元，通过服务间定义良好的接口和契约联系起来SOA与大多数通用的客户端/服务器模型的不同之处，在于它着重强調软件组件的松散耦合并使用独立的标准接口

和DOM等编程技术，可以让开发人员构建基于Ajax技术的Web应用并打

破了使用页面重载的惯例。

Web Service是┅种以SOAP为轻量型传输协议、以XML为数据封装标准、基

于HTTP的组件集成技术Web Service主要是为了使原来各孤立的站点之间

的信息能够相互通信、共享而提出的一种接口。

多个系统中用户一次登录即可访问所有他有权访问的所有子系统。单点登录就是要实现通过一次登录自动访问的所有授权的应用软件系统从而提高整体安全性，而且无需记忆多种登录过程、ID或口令