<div dir="ltr">Dear Amos,<div><br></div><div>Thank you for your input.</div><div><br></div><div>The reason I had this requirement is to build a analytics app on top of Squid which will only show typed URL's so that the end user has the precise information w.r.t evaluating web access. </div><div><br></div><div>Currently, since everything gets logged into the access.log, there is no way to differentiate between typed/bookmark accessed URL's and URL's which are references for the main URL i.e CDN URL's for js, css etc. </div><div><br></div><div>Sorry if I am pressing here, but do you have any suggestions/alternate solutions for how I could achieve this ? </div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Nov 20, 2014 at 7:37 PM, Amos Jeffries <span dir="ltr"><<a href="mailto:squid3@treenet.co.nz" target="_blank">squid3@treenet.co.nz</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">-----BEGIN PGP SIGNED MESSAGE-----<br>
Hash: SHA1<br>
<div><div class="h5"><br>
On 21/11/2014 1:18 a.m., Swapneel Patnekar wrote:<br>
> Hi there,<br>
><br>
> I need to pull/fetch high level URL requests from the Squid<br>
> access.log i.e URL requests which were typed by the user in the<br>
> browser.<br>
><br>
> For example, if the user had typed <a href="http://facebook.com" target="_blank">facebook.com</a>, I want to<br>
> pull/fetch only <a href="http://facebook.com" target="_blank">facebook.com</a> from the access.log and not<br>
> <a href="https://fbstatic-a.akamaihd.net/rsrc.php/v2/yV/r/aXwjx2fqSf4.css" target="_blank">https://fbstatic-a.akamaihd.net/rsrc.php/v2/yV/r/aXwjx2fqSf4.css</a><br>
> etc which was not typed by the user in the browser but was<br>
> referenced by <a href="http://facebook.com" target="_blank">facebook.com</a> for the CSS.<br>
><br>
> Can this be done ?<br>
<br>
</div></div>No it can't.<br>
<br>
There is absolutely no way for Squid to identify what the user (if one<br>
even exists) has done with their keyboard (or shortcuts, or bookmarks,<br>
or search bar or...) that started the HTTP to happen.<br>
<br>
You can log the "Referer" header contents, requests with no Referer<br>
value are usually "first" requests. But that header is not always sent<br>
or is sent when users change "page". So the accuracy is very low for<br>
what you are asking to get out of it.<br>
<br>
FWIW: "<a href="http://facebook.com" target="_blank">facebook.com</a>" is a rarely visited page. Most of the users<br>
search for it by company name and click the results, or use history<br>
and bookmarks, even the emailed links FB sends out. All of which dump<br>
them straight into the middle of some sub-section of the FB site.<br>
<br>
Amos<br>
<br>
-----BEGIN PGP SIGNATURE-----<br>
Version: GnuPG v2.0.22 (MingW32)<br>
<br>
iQEcBAEBAgAGBQJUbfWhAAoJELJo5wb/XPRjaeQH/0uWTCtDq9DNvNNXUVo103g4<br>
nFAvaT5kcaEJxRNOCTMerLwSAIrqyhT+SpqnmbSJURskwmW8vZRodIAnQPXPfiCj<br>
QuAazwDywVq0n7SyAtyIzyK0I6qlVtuKD+3VHcCJ30AXMv4RUv3ne8WenVLYggOq<br>
KGfTAS5rXUQvnAKpSz+jRGY4ZS7ZJ7dxrrPZwUxsBqXiNAwJpesZVScnxMtiXdsN<br>
Ko+/CMUDA4i35pAsc/l/GtGQozPtlsMtiXm7V5Vg+p9r01gIIaUWA6DuatBuB6RR<br>
QqMsMWKm66HpeD8Kw/MMx81yKOXpEZYRpuGxoxs9CU/rrAd1uugjUR/3D1QLcgs=<br>
=7n1w<br>
-----END PGP SIGNATURE-----<br>
<div class="HOEnZb"><div class="h5">_______________________________________________<br>
squid-users mailing list<br>
<a href="mailto:squid-users@lists.squid-cache.org">squid-users@lists.squid-cache.org</a><br>
<a href="http://lists.squid-cache.org/listinfo/squid-users" target="_blank">http://lists.squid-cache.org/listinfo/squid-users</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>
</div></div>