V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Tianpu  ›  全部回复第 4 页 / 共 25 页
回复总数  492
1  2  3  4  5  6  7  8  9  10 ... 25  
已经解决了,叫做后向引用

```
<block\.([a-z]+)>(.*?)<block\.\1>
```
===
2015-08-30 17:21:51 +08:00
回复了 summering 创建的主题 随想 过来围观 感觉论坛气氛不错
@summering

https://github.com/greatghoul/sibi

╰╮綪叫що檑鋒蜀黍╭╯
2015-08-28 16:50:24 +08:00
回复了 UPYUN 创建的主题 云计算 UPYUN 云存储免费了!
?
2015-08-27 23:03:26 +08:00
回复了 lshero 创建的主题 服务器 发现 18 刀独立服务器
2015-08-27 00:05:02 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@vibbow 我只有一次写的需求,其实对速度要求也不是那么敏感

就是上午做了个自定义函数的自动测试,发现用到 mb_*都是 0.0xms+这个级别的,其它的都是 0.001ms-的时间消耗

然后就想弄清楚到底怎么回事,可能还是得自己维护个 alphabet ,简单的不长的字符串替换还是很快的,有限的文本总是有更多的办法来提升速度
2015-08-26 23:53:58 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@vibbow 多谢

很可能找到根源了
PHP 和大小写相关的函数都是慢的

可是: stristr, strtoupper,ucwords,strtolower 又似乎是必须的
2015-08-26 23:48:40 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@vibbow 主要是不想还要检查是不是考虑了大小写

大小写敏感慢的话 很可能是一脉相承的慢 mb_convert_case 相关的都慢死 其它的只是一般的慢 stristr str_ireplace 这些都应该慢了

暂时我就使用 mb_*了 等有空 再整理数据改写下
2015-08-26 23:43:07 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
在同一个环境下,不考虑结果的正确性, stristr 的单次运行耗时是 0.0006ms

比例关系大致是:
stristr 1
pcre_stristr 7
mb_stristr 120

这个比例和看到的另外测试是一致的,应该是可靠的结果
2015-08-26 23:35:57 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@xzem
@jhdxr
@jfcherng

字符串样本是 0123456789abcdefghijklmnopqrstuvwxyzÁáÀàÂâÄäÃãĄąÆæÇçÉéÈèÊêËëĘęÍíÎîÌìÏïĮįÑñÓóÒòÔôÖöÕõŒœŞşẞßÚúÙùÛûÜüŲųŸÿ0123456789abcdefghijklmnopqrstuvwxyzÁáÀàÂâÄäÃãĄąÆæÇçÉéÈèÊêËëĘęÍíÎîÌìÏïĮįÑñÓóÒòÔôÖöÕõŒœŞşẞßÚúÙùÛûÜüŲųŸÿ

随机 1000 个短文本测试 stristr ,字符串ß的大小写没有处理,其它兼容性应该不存在了

pcre 大致是只需要 5%的运行时间

pcre 内部应该也有个 unicode 的大小写字母表,匹配没有问题,转换大小写好像没什么办法

除了 mb_convert_case 外,其它 mb_*函数都应该容易改写
2015-08-26 21:36:33 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@xzem 我待会先简单测试下看看, strtoupper 和 stristr
2015-08-26 21:35:00 +08:00
回复了 Tianpu 创建的主题 PHP mb_*系列函数真是慢啊,这种原生函数有什么好的替代品吗?
@jhdxr 文本处理呀

虚拟机上测试
mb_stristr
mb_strtolower
mb_strtoupper
mb_convert_case
这几个都是 0.05ms 左右
对比不带 mb_的只是 0.002ms

mb_split 好一些,是 0.01ms

我预感用正则重写至少前面几个可以达到 0.01ms

正则的坏处是 mb_系列函数毕竟有它的优势,比如同意字符处理,因此重写可能有坑
2015-08-25 17:14:47 +08:00
回复了 pythonfan 创建的主题 Python 如何在短时间内扫描完成一个很大的监控列表呢?
监控很多,需要队列吧

然后分配权重,关注多的刷新频率高,少的低

设置最高,最低,根据权重分配抓取时间间隔?

觉得半小时甚至半天更新一次都可以吧,一分钟更新一次价格不是很合理需求吧
昨天刚查的资料,这个应该属于标记符号吧,过滤你

\s{M}

http://www.regular-expressions.info/unicode.html
@westlinkin

申請人須提供如下身份證明文件的原件(香港開戶證件和內地參考證件都必
須提供,證件須在有效期內且剩餘有效期必須大於半年):
申請人的國籍 /地區 香港開戶證件 內地參考證件
內地居民
內地居民往來港澳通行證
/中國護照 / 香港居民身份證
大陸居民身份證

貌似通行证是必须的
@800126 多谢
2015-08-24 15:21:26 +08:00
回复了 honkew 创建的主题 PHP 有多少会写的
定义很容易:

一天就是 Y-m-d 一样的时间戳
一月就是 Y-m 一样的时间戳
一年就是 Y 一样的时间戳

必定存在的:
每日的 Y-m-d 00:00:00 (需要检查当月的 Y-m-d 是否存在)
每月的 Y-m-01 00:00:00 (需要检查下当月的 Y-m 是否存在)
每年的 Y-01-01 00:00:00 (需要检查当年的 Y 是否存在)

已知这些东西,使用筛法都能快速筛出来了
比如以 step=1s 筛 1000 年,腌起来风干了吃
2015-08-21 15:59:35 +08:00
回复了 liuhy1991 创建的主题 职场话题 实习生,被公司上司安排做与他个人相关的私活
很有可能,这是你实习最有价值的工作了
@jacy

// quote start

@inmyfree 常识是 3G ?我怎么谷歌“ 32 位系统最大内存 3G ”没有结果?好厉害的常识

// quote end

仅仅针对这一句的回复, https://www.google.com/search?q=32+%E4%BD%8D%E7%B3%BB%E7%BB%9F%E6%9C%80%E5%A4%A7%E5%86%85%E5%AD%98+3G , 1 2 3 4 5 条搜索结果都有明确的解释

不知道是说谎还是天资愚鲁造成的搜索不到。
2015-08-16 16:33:26 +08:00
回复了 gaohongyuan 创建的主题 macOS 一边用电脑一边 Time Machine 备份的时候,怎么保证同步?
inotify?
1  2  3  4  5  6  7  8  9  10 ... 25  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   948 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 21:10 · PVG 05:10 · LAX 13:10 · JFK 16:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.