[phantomjs -v 1.9.7]与
NightmareJS:
https://github.com/segmentio/nightmare
通过使用超时选项的一个示例,可以最好地设置这些选项:
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
也尝试过
new Nightmare({ignoreSslErrors : true, sslProtocol : 'tlsv1'})
它不会打开https页面。
如果我直接使用phantomjs来访问同一页面,则效果很好:
phantomjs --ignore-ssl-errors=true --ssl-protocol=tlsv1 testBot.js
*** testBot.js
var page = require('webpage').create();
var url = 'https://www.some-https-site/login/';
page.onConsoleMessage = function(msg) {
console.log('Page title is ' + msg);
};
page.open(url, function(status) {
page.evaluate(function() {
console.log(document.title);
});
phantom.exit();
});
这段代码很乱,但是当我将站点切换回HTTP而不是HTTPS时,它可以完美地工作。
// Main nightmare call
// Code is quite messy, i know.
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.useragent('chrome')
.use(openpage())
.evaluate(function() {
return document.title;
},function(title) {
// console.info('FALSE = not logged in');
console.info('title : ' + title);
if (title === 'Login'){
console.info('false');
loginCheckBit = false;
}else if (title === 'Print Invoice'){
loginCheckBit = true;
console.info('true');
}else{
console.info('#########################################');
console.info(' NEED TO TROUBLESHOOT scraper looks lost');
console.info('#########################################');
}
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
if (!loginCheckBit){
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(login(user))
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('#################');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}else{
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(openpage())
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('################');
console.info('inside 2nd eval');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}
});
function openpage(user){
console.info('============ BOT URL CALL =============');
console.info(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/');
console.info('====================================');
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.wait();
};
}
function login(user){
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
.click('.btn-login')
.wait();
};
}
我知道HTTPS调用'login'函数时失败,并且找不到输入框:
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
Nightmare 将为输入框返回错误,并且页面标题为空。它应该是:“登录”还是“打印发票”,具体取决于“机器人”是否已登录。
以下线程将我带到了关于'tlsv1'的正确方向:PhantomJS failing to open HTTPS site,但我只是无法使其在Nightmare中正常工作。
最佳答案
好的,所以我的房东已经在Ubuntu 12.04上配置了我,就像我进行常规升级一样,我要求他们重新配置Ubuntu 14.04。我运行了安装/部署脚本。因此完全相同的代码库。现在正在工作!
我的脚本以完全相同的方式安装了完全相同的PhantomJS和NightmareJS版本。因此,我现在真的不知道问题是什么。但是,如果有人尝试类似的操作并有疑问,我上面的代码是正确的,并且可以正常工作。