Переехал из темы "Wget для Windows" с такой задачей:
имеется хост, с которого по протоколу HTTP нужно периодически выкачивать тлько новые или изменённые файлы c именами вида baseMMDD.rar, где MM-месяц, DD-число. Простой скачки файлов добился, с помощью комрада
igor_andreev.
Но вся проблема в том, что каждый раз скачиваются все подряд файлы, потому что хост не умеет отдавать дату последнего изменения файлов и присваивает им текущую дату.
Но в то же время в файл FOLDER1.TXT напротив каждого файла пишется дата и время его последнего изменения и размер.
Вот сам скрипт:
Цитата: set http_proxy=http://192.168.150.1:8080
wget -O C:\Temp\FOLDER1.TXT --http-user="user" --http-passwd="pass" http://info.board.ru/auth.php?item=FOLDER1/
sed "s/<\/td>/\n/g" C:\Temp\FOLDER1.TXT | find /i ".rar" >C:\Temp\FILES1.TXT
wget -N --force-html -P C:\Temp\
--base=http://info.board.ru/ --http-user="user" --http-passwd="pass" -i C:\Temp\FILES1.TXT
Вот что пишется в FOLDER1.TXT
[more] <img src="/images2/folder_open.gif" alt='root dir'> Folder1/<table border=0><tr align="center"><td></td><td>Наименование</td><td> </td><td>Дата/время</td><td> </td><td>Размер</td></tr><tr align="left"><td colspan="6"><hr></td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0428.RAR'>base0428.RAR</a></td><td> - </td><td>28-04-2007 09:33:22</td><td> - </td><td>1,61 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0423.RAR'>base0423.RAR</a></td><td> - </td><td>23-04-2007 09:55:08</td><td> - </td><td>1,71 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0416.RAR'>base0416.RAR</a></td><td> - </td><td>16-04-2007 09:42:47</td><td> - </td><td>1,50 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0409.RAR'>base0409.RAR</a></td><td> - </td><td>09-04-2007 09:43:05</td><td> - </td><td>852,07 Кбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0402.RAR'>base0402.RAR</a></td><td> - </td><td>02-04-2007 09:36:38</td><td> - </td><td>987,13 Кбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0326.RAR'>base0326.RAR</a></td><td> - </td><td>26-03-2007 10:07:41</td><td> - </td><td>1,16 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0319.RAR'>base0319.RAR</a></td><td> - </td><td>19-03-2007 09:48:29</td><td> - </td><td>1,20 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0312.RAR'>base0312.RAR</a></td><td> - </td><td>12-03-2007 09:42:46</td><td> - </td><td>1,38 Мбайт</td></tr><td width=30><img src="/images2/file.gif" alt="[FILE]"></td><td><a href='auth.php?item=Folder1/base0305.RAR'>base0305.RAR</a></td><td> - </td><td>05-03-2007 09:48:48</td><td> - </td><td>1,28 Мбайт</td></tr><tr align="left"><td colspan="6"><hr></td></tr></table>[/more]
Вот что пишется в файл FILES1.TXT
[more] <td><a href='auth.php?item=FOLDER1/base0428.RAR'>base0428.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0423.RAR'>base0423.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0416.RAR'>base0416.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0409.RAR'>base0409.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0402.RAR'>base0402.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0326.RAR'>base0326.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0319.RAR'>base0319.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0312.RAR'>base0312.RAR</a>
<td><a href='auth.php?item=FOLDER1/base0305.RAR'>base0305.RAR</a>[/more]
Помогите решить задачу по скачке только новых или измененных файлов. Для этого надо как-то разобрать FOLDER1.TXT и цепляться за дату и время каждого файла, которые туда пишутся.