Hi Melissa,<br><br><blockquote style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;" class="gmail_quote">My guess is that a large portion of this metadata is occupied by<br>
TiffData elements.</blockquote><div><br>Indeed.<br> </div><blockquote style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;" class="gmail_quote">One idea would be to update Bio-Formats&#39; OME-TIFF writer<br>


to be a bit smarter about how TiffData elements are written, which may<br>
substantially shrink the size of the metadata in each file without<br>
requiring a schema change.<br></blockquote><br>In general I agree that making the OME-TIFF writer smarter is a good thing.<br><br>However, in the case of one plane per TIFF file, the specification requires a separate TiffData element per plane, to indicate the UUID of each file. So I don&#39;t think you&#39;ll be able to achieve much savings there...<br>

<br>-Curtis<br><br><div class="gmail_quote">On Tue, Oct 12, 2010 at 2:48 PM, Melissa Linkert <span dir="ltr">&lt;<a href="mailto:melissa@glencoesoftware.com">melissa@glencoesoftware.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

<div class="im">Hi Rubén,<br>
<br>
&gt; @Curtis: Actually we face this problem with very large datasets instead. One<br>
&gt; of our time-lapse acquisitions has 23000 ome.tif files, each is 8M = 2.5M +<br>
&gt; 5.5 M headers. This kind of storage can not be afforded by some groups.<br>
<br>
</div>My guess is that a large portion of this metadata is occupied by<br>
TiffData elements.  One idea would be to update Bio-Formats&#39; OME-TIFF writer<br>
to be a bit smarter about how TiffData elements are written, which may<br>
substantially shrink the size of the metadata in each file without<br>
requiring a schema change.<br>
<br>
I do agree with Curtis that we should at least consider making a change to the<br>
OME-XML schema, but in the meantime that may be a partial solution.<br>
However, as mentioned before, it would help to see the exact OME-XML<br>
that you are working with.  We wouldn&#39;t want to implement a solution<br>
only to find out that it doesn&#39;t solve your problem.<br>
<div class="im"><br>
&gt; @Melissa: Do you think that a tool that could group or split datasets could<br>
&gt; also deal with the Leica Matrix Screener OME.TIF. My tool will assume that<br>
&gt; all the headers are the same, but I know that is not like that. Therefore I<br>
&gt; think that unification of the headers is a good idea, in the future.<br>
<br>
</div>It&#39;s possible, but I as mentioned before I really think you would be<br>
better off waiting for proper Leica Matrix support in Bio-Formats.<br>
<br>
Regards,<br>
<font color="#888888">-Melissa<br>
</font><div><div></div><div class="h5"><br>
On Tue, Oct 12, 2010 at 02:20:28PM -0500, Curtis Rueden wrote:<br>
&gt; Hi Rubén,<br>
&gt;<br>
&gt; @Curtis: Actually we face this problem with very large datasets instead. One<br>
&gt; &gt; of our time-lapse acquisitions has 23000 ome.tif files, each is 8M = 2.5M +<br>
&gt; &gt; 5.5 M headers. This kind of storage can not be afforded by some groups.<br>
&gt; &gt;<br>
&gt;<br>
&gt; Thanks, that explanation helps a lot!<br>
&gt;<br>
&gt; It sounds like this is a use case for either:<br>
&gt;<br>
&gt; A) Putting the metadata in only the first .ome.tif file; or<br>
&gt; B) Putting the metadata in a companion file.<br>
&gt;<br>
&gt; Each OME-TIFF would still need a small amount of metadata (particularly the<br>
&gt; UUID associated with it) but the bulk of it could in principle be stripped<br>
&gt; out.<br>
&gt;<br>
&gt; I am all in favor of either of these options being supported in the next<br>
&gt; OME-XML schema, but in the past there has been strong opposition, due to<br>
&gt; concern about metadata being lost by a partial copy. Perhaps this concrete<br>
&gt; use case justifies reversing our decision on this? Anyone have any other<br>
&gt; ideas?<br>
&gt;<br>
&gt; To split each serie in different ome.tif datasets seems like our solution.<br>
&gt; &gt; Do you think its convenient? Are there tools for this? I am working in one<br>
&gt; &gt; already.<br>
&gt; &gt;<br>
&gt;<br>
&gt; You could definitely do that, but it seems a shame. You would be<br>
&gt; compromising the modeling of your data, just to work around an unfortunate<br>
&gt; implementation detail of OME-TIFF. Better would be for us to provide a<br>
&gt; better solution with the next schema release.<br>
&gt;<br>
&gt; -Curtis<br>
&gt;<br>
&gt; On Tue, Oct 12, 2010 at 1:32 PM, Rubén Muñoz &lt;<a href="mailto:ruben.munoz@embl.de">ruben.munoz@embl.de</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; Hi Curtis and Melissa,<br>
&gt; &gt;<br>
&gt; &gt; On Oct 12, 2010, at 5:41 PM, Curtis Rueden &lt;<a href="mailto:ctrueden@wisc.edu">ctrueden@wisc.edu</a>&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt; Hi Rubén &amp; Melissa,<br>
&gt; &gt;<br>
&gt; &gt; &gt; Is there a way of excluding the image/pixel list in all the OME.TIF with<br>
&gt; &gt;&gt; bfconvert?<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Perhaps I am misunderstanding the question, but are you asking about<br>
&gt; &gt;&gt; excluding the Image and Pixels elements from the OME-XML metadata?<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Yes that&#39;s my question.<br>
&gt; &gt;<br>
&gt; &gt; If<br>
&gt; &gt;&gt; so, then I&#39;m afraid that that is really not possible - both elements<br>
&gt; &gt;&gt; provide critical metadata for reading the pixel data.<br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Thats how I understand the specification. All the files are<br>
&gt; &gt; cross-referenced in the OME.TIF headers by Pixel elements, independently of<br>
&gt; &gt; the number of files in the set...<br>
&gt; &gt;<br>
&gt; &gt; Note: We store all the planes &amp; timepoins &amp; channels in different files for<br>
&gt; &gt; convenience, that&#39;s not a matter of discussion anymore here, since our<br>
&gt; &gt; software doesn&#39;t always operate on stacks.<br>
&gt; &gt;<br>
&gt; &gt; This could conceivably happen with extremely small image planes. For<br>
&gt; &gt; example, an 8x8 image at 8-bit resolution only occupies 64 bytes, but the<br>
&gt; &gt; metadata would be at least ~180 bytes; e.g.:<br>
&gt; &gt;<br>
&gt; &gt; &lt;Image ID=&quot;Image:xxxx&quot; Name=&quot;Image xxxx&quot;&gt;&lt;Pixels DimensionOrder=&quot;XYCZT&quot;<br>
&gt; &gt; ID=&quot;Pixels:xxxx&quot; SizeC=&quot;1&quot; SizeT=&quot;1&quot; SizeX=&quot;8&quot; SizeY=&quot;8&quot; SizeZ=&quot;1&quot;<br>
&gt; &gt; Type=&quot;uint8&quot;&gt;&lt;TiffData/&gt;&lt;/Pixels&gt;&lt;/Image&gt;<br>
&gt; &gt;<br>
&gt; &gt; I can&#39;t think of any other case where the metadata size exceeds the pixel<br>
&gt; &gt; size. Rubén, can you elaborate on what is going on? What are the dimensions<br>
&gt; &gt; of your images? How many screens, plates, wells, and what is the image<br>
&gt; &gt; resolution?<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; @Curtis: Actually we face this problem with very large datasets instead.<br>
&gt; &gt; One of our time-lapse acquisitions has 23000 ome.tif files, each is 8M =<br>
&gt; &gt; 2.5M + 5.5 M headers. This kind of storage can not be afforded by some<br>
&gt; &gt; groups.<br>
&gt; &gt;<br>
&gt; &gt; My colleagues plan to make bigger experiments, and I we are facing storage<br>
&gt; &gt; issues. And bioformats needs more memory to convert large datasets.<br>
&gt; &gt;<br>
&gt; &gt; To split each serie in different ome.tif datasets seems like our solution.<br>
&gt; &gt; Do you think its convenient? Are there tools for this? I am working in one<br>
&gt; &gt; already.<br>
&gt; &gt;<br>
&gt; &gt; @Melissa: Do you think that a tool that could group or split datasets could<br>
&gt; &gt; also deal with the Leica Matrix Screener OME.TIF. My tool will assume that<br>
&gt; &gt; all the headers are the same, but I know that is not like that. Therefore I<br>
&gt; &gt; think that unification of the headers is a good idea, in the future.<br>
&gt; &gt;<br>
&gt; &gt; Thanks for your replies,<br>
&gt; &gt;<br>
&gt; &gt; Rubén<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; -Curtis<br>
&gt; &gt;<br>
&gt; &gt; On Tue, Oct 12, 2010 at 10:23 AM, Melissa Linkert &lt;&lt;<a href="mailto:melissa@glencoesoftware.com">melissa@glencoesoftware.com</a>&gt;<br>
&gt; &gt; <a href="mailto:melissa@glencoesoftware.com">melissa@glencoesoftware.com</a>&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt;&gt; Hi Rubén,<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; Is there a way of excluding the image/pixel list in all the OME.TIF with<br>
&gt; &gt;&gt; bfconvert?<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Perhaps I am misunderstanding the question, but are you asking about<br>
&gt; &gt;&gt; excluding the Image and Pixels elements from the OME-XML metadata?  If<br>
&gt; &gt;&gt; so, then I&#39;m afraid that that is really not possible - both elements<br>
&gt; &gt;&gt; provide critical metadata for reading the pixel data.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; For large multi-file sets the metadata is bigger than the pixel values<br>
&gt; &gt;&gt; and this prevents us to use OME.TIF in High Throughput Screens.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; That is a bit strange, but I have a few ideas as to what might be<br>
&gt; &gt;&gt; happening there.  I imagine the OME-TIFF file is prohibitively large,<br>
&gt; &gt;&gt; but if you could send just the OME-XML metadata that would be a huge<br>
&gt; &gt;&gt; help.  You can extract the metadata like this:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;  # if all of the Bio-Formats command-line tools are installed<br>
&gt; &gt;&gt;  $ tiffcomment /path/to/file.ome.tiff<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;  # if &#39;tiffcomment&#39; is not installed<br>
&gt; &gt;&gt;  $ java loci.formats.tools.TiffComment /path/to/file.ome.tiff<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; I&#39;d like to help with the Leica Matrix Screener and ZEN importers as<br>
&gt; &gt;&gt; much as possible.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Thank you for the offer.  At the moment, there is not much that can be<br>
&gt; &gt;&gt; done with the Zeiss LSM/Zen reader.  It will be at least a few weeks<br>
&gt; &gt;&gt; before I can do anything with the Leica Matrix reader, but you are more<br>
&gt; &gt;&gt; than welcome to start on a reader in the meantime if you like.  There<br>
&gt; &gt;&gt; are three main pieces of work to be done for this reader:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;  1) Make sure that all of the files are grouped together correctly, no<br>
&gt; &gt;&gt;  matter which file in the dataset is selected by the user.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;  2) Make sure that all of the pixel data and &#39;core&#39; metadata is read<br>
&gt; &gt;&gt;  correctly.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;  3) Make sure that all of the OME-XML metadata from each of the<br>
&gt; &gt;&gt;  constituent OME-TIFFs is parsed and unified.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; My plan is to roughtly model the Leica Matrix reader after<br>
&gt; &gt;&gt; loci.formats.in.MIASReader and loci.formats.in.InCellReader, with an<br>
&gt; &gt;&gt; internal loci.formats.in.OMETiffReader doing much of the work for (2)<br>
&gt; &gt;&gt; and (3).<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Alternatively, you can wait a bit until I&#39;ve had time to write an initial<br>
&gt; &gt;&gt; version, and then help with the testing and polishing.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Regards,<br>
&gt; &gt;&gt; -Melissa<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; On Mon, Oct 11, 2010 at 09:51:56PM +0200, Rubén Muñoz wrote:<br>
&gt; &gt;&gt; &gt; Hi Melissa,<br>
&gt; &gt;&gt; &gt; Is there a way of excluding the image/pixel list in all the OME.TIF with<br>
&gt; &gt;&gt; bfconvert?<br>
&gt; &gt;&gt; &gt; For large multi-file sets the metadata is bigger than the pixel values<br>
&gt; &gt;&gt; and this prevents us to use OME.TIF in High Throughput Screens. I&#39;d like to<br>
&gt; &gt;&gt; help with the Leica Matrix Screener and ZEN importers as much as possible.<br>
&gt; &gt;&gt; &gt; Best regards,<br>
&gt; &gt;&gt; &gt; Rubén<br>
&gt; &gt;&gt; &gt;<br>
&gt; &gt;&gt; &gt; On Oct 11, 2010, at 8:22 PM, Melissa Linkert &lt;&lt;<a href="mailto:melissa@glencoesoftware.com">melissa@glencoesoftware.com</a>&gt;<br>
&gt; &gt;&gt; <a href="mailto:melissa@glencoesoftware.com">melissa@glencoesoftware.com</a>&gt; wrote:<br>
&gt; &gt;&gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; Hi Rubén,<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; That&#39;s good news. I am amazed by how the project evolves from simpler<br>
&gt; &gt;&gt; to more sophisticated needs. Actually bfconvert was designed to convert I<br>
&gt; &gt;&gt; guess, but I was trying to transform Leica Matrix Screener multiple OME.TIF<br>
&gt; &gt;&gt; to one-big OME.TIF and then enrich the metadata.<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; If possible, I would recommend waiting for this ticket to be closed:<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; &lt;<a href="http://dev.loci.wisc.edu/trac/software/ticket/563" target="_blank">http://dev.loci.wisc.edu/trac/software/ticket/563</a>&gt;<br>
&gt; &gt;&gt; <a href="http://dev.loci.wisc.edu/trac/software/ticket/563" target="_blank">http://dev.loci.wisc.edu/trac/software/ticket/563</a><br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; ...at which point you can just do &#39;bfconvert<br>
&gt; &gt;&gt; leica-matrix-file.ome.tiff output.ome.tiff&#39; without any additional magic.<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; To give dimensionally to a dataset is my goal. Could one edit the<br>
&gt; &gt;&gt; metadata with EditTiffComment for that? Would a tool like EditTiffComment<br>
&gt; &gt;&gt; that modifies the metadata of many files accordingly be usefull?<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; You could use one of our TIFF comment editing utilities:<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; * java loci.formats.tools.TiffComment -edit /path/to/file<br>
&gt; &gt;&gt; &gt; &gt; * java loci.formats.tools.EditTiffG /path/to/file<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; But please be very, very cautious.  Again, the above ticket really is<br>
&gt; &gt;&gt; &gt; &gt; the best solution, so if you can I would recommend either waiting for<br>
&gt; &gt;&gt; &gt; &gt; that ticket to be closed or (if you have a lot of free time) helping<br>
&gt; &gt;&gt; to implement it.<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; Regards,<br>
&gt; &gt;&gt; &gt; &gt; -Melissa<br>
&gt; &gt;&gt; &gt; &gt;<br>
&gt; &gt;&gt; &gt; &gt; On Wed, Oct 06, 2010 at 02:46:50PM +0200, Rubén Muñoz wrote:<br>
&gt; &gt;&gt; &gt; &gt;&gt; Hi Melissa,<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; On Oct 6, 2010, at 1:09 AM, Melissa Linkert wrote:<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; Hi Rubén,<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;&gt; Therefore tried this with bfconvert, even when appending to<br>
&gt; &gt;&gt; existing OME.TIF is not supported yet.<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; Appending to existing OME-TIFF files is, in theory, supported.<br>
&gt; &gt;&gt;  However,<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; the MetadataRetrieve object used by OMETiffWriter must be correctly<br>
&gt; &gt;&gt; set<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; up, which unfortunately will not happen by repeatedly calling<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; bfconvert.<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; That&#39;s good news. I am amazed by how the project evolves from simpler<br>
&gt; &gt;&gt; to more sophisticated needs. Actually bfconvert was designed to convert I<br>
&gt; &gt;&gt; guess, but I was trying to transform Leica Matrix Screener multiple OME.TIF<br>
&gt; &gt;&gt; to one-big OME.TIF and then enrich the metadata.<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;&gt; However wIth the latest revision of bioformats 7034 when I output<br>
&gt; &gt;&gt; the bfconvert to the same file consecutively, the file is always getting<br>
&gt; &gt;&gt; bigger in size.<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; Yes, I see the same behavior.  It is ticketed here:<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; &lt;<a href="http://dev.loci.wisc.edu/trac/software/ticket/578" target="_blank">http://dev.loci.wisc.edu/trac/software/ticket/578</a>&gt;<br>
&gt; &gt;&gt; <a href="http://dev.loci.wisc.edu/trac/software/ticket/578" target="_blank">http://dev.loci.wisc.edu/trac/software/ticket/578</a><br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; And, as usual, you have been CC&#39;d.  I am a bit curious though: why<br>
&gt; &gt;&gt; run<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; bfconvert repeatedly with the same output file?  Are you trying to<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; convert multiple datasets to a single OME-TIFF file?  If I know the<br>
&gt; &gt;&gt; use<br>
&gt; &gt;&gt; &gt; &gt;&gt;&gt; case, then maybe there is a work-around until the above ticket is<br>
&gt; &gt;&gt; closed.<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; To give dimensionally to a dataset is my goal. Could one edit the<br>
&gt; &gt;&gt; metadata with EditTiffComment for that? Would a tool like EditTiffComment<br>
&gt; &gt;&gt; that modifies the metadata of many files accordingly be usefull?<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; Another topic, I guess you remember about the Zeiss ZEN software,<br>
&gt; &gt;&gt;  multiple positions in the same LSM file are now supported.<br>
&gt; &gt;&gt; &gt; &gt;&gt; I recently found out that it also produces multi-file LSM datasets<br>
&gt; &gt;&gt; (without .mdb). I am getting one of these. I wonder how these files now<br>
&gt; &gt;&gt; about each other, but could be that they don&#39;t.<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; Best regards,<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt; Rubén<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; &gt; &gt;&gt;<br>
&gt; &gt;&gt; _______________________________________________<br>
&gt; &gt;&gt; ome-devel mailing list<br>
&gt; &gt;&gt;  &lt;<a href="mailto:ome-devel@lists.openmicroscopy.org.uk">ome-devel@lists.openmicroscopy.org.uk</a>&gt;<br>
&gt; &gt;&gt; <a href="mailto:ome-devel@lists.openmicroscopy.org.uk">ome-devel@lists.openmicroscopy.org.uk</a><br>
&gt; &gt;&gt;  &lt;<a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a>&gt;<br>
&gt; &gt;&gt; <a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a><br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
</div></div></blockquote></div><br>