您好,我在目录中有一系列html文件,名为transactiondata1.html,transactiondata2.html等。在这些HTML文件中,事务信息被掩埋的兴趣参数:
客户名称: B> Michael Henesi
...
事务ID: b> 21987335670
事务ID有不同的长度,有时不可用(该字段中没有条目)。有时会有多个事务。有时,事务ID被指定为:
< b >事务ID: < / b > 21987335670
也就是说,交易ID之前的空间变为结肠后的空间。
在某些HTML文件中,缺少客户名称和事务ID信息。
目标是在一个文本文件中获取目录中所有文件中的所有Transaction id以及Customer Names。如何做到这一点?