声振论坛

 找回密码
 我要加入

QQ登录

只需一步,快速开始

查看: 2212|回复: 0

[编程技巧] matlab抓取网页数据

[复制链接]
发表于 2015-10-16 09:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?我要加入

x
00.png
  1. clc;
  2. clear;
  3. warning off;
  4. % [sourcefile, status] = urlread(sprintf('http://trend.baidu.lecai.com/fc3d/baseTrend.action?recentPhase=30&onlyBody=false&phaseOrder=up&coldHotOrder=number'));
  5. %这个是彩票数据的网址
  6. [sourcefile, status] =urlread(sprintf('http://888.qq.com/static/chart/fc3d/'));
  7. if ~status
  8.     error('读取错误\n')
  9. end
  10. %获取日期
  11. expr1='<td align="center">(\d\d\d\d-\d\d-\d\d)</td>';
  12. [datefile, date_tokens]= regexp(sourcefile, expr1, 'match', 'tokens');
  13. date = cell(size(date_tokens));
  14. for idx = 1:length(date_tokens)
  15.     date{idx} = date_tokens{idx}{1};    %length(date_tokens)行1列
  16. end

  17. %%获取3D的三位数字
  18. expr2='<td class="chartBall01" width=18>(\d)</td>';
  19. [datafile, data_tokens] = regexp(sourcefile, expr2, 'match', 'tokens');
  20. data = zeros(size(data_tokens));
  21. for idx = 1:length(data_tokens)
  22.     data(idx) = str2double(data_tokens{idx}{1});  
  23. end

  24. data1=reshape(data,3,length(data)/3)';
  25. %%%数据存储外部文件
  26. fprintf('完成!\n')
复制代码


转自:http://blog.163.com/zzz216@yeah/ ... 684201412091844681/
回复
分享到:

使用道具 举报

您需要登录后才可以回帖 登录 | 我要加入

本版积分规则

QQ|小黑屋|Archiver|手机版|联系我们|声振论坛

GMT+8, 2024-12-1 12:29 , Processed in 0.066510 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表