Hi Alessandro,<br><br><blockquote style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;" class="gmail_quote">Based on your experience how much increase in size we could expect from a
 &quot;one in ten&quot;, or &quot;one in hundred&quot; files with metatada redundancy ? I 
think that some estimations would be of great help in order to better 
 understand what could be the impact of this implementation on the IT 
Departments and HCS Facilities operations.<br></blockquote>
<br>From what Rubén told me, a typical situation might be 2.5MB of binary data (pixels) per TIFF file, and 5.5MB of OME-XML. Over 23,000 TIFF files, that&#39;s 180GB when stored with metadata in every file, but only 56GB if the metadata is stored once only—more than 3X difference. Storing the metadata in 1/10th of the TIFFs would require ~69GB of storage, which amounts to nearly 13GB of wasted disk. Storing the metadata in 1/100th of the TIFFs would require ~57GB, wasting a mere 1GB of disk.<br>

<br>To be clear, I think it is fine to adopt such a strategy, but my point is that it should be the institution&#39;s choice. With the master/slave proposal, it would be totally configurable how often to replicate the OME-XML metadata. You could store the metadata for one file only, for all files, or for some subset as you propose.<br>

<br>-Curtis<br><br><div class="gmail_quote">On Wed, Dec 8, 2010 at 12:59 PM, Alessandro Dellavedova <span dir="ltr">&lt;<a href="mailto:alessandro.dellavedova@ifom-ieo-campus.it" target="_blank">alessandro.dellavedova@ifom-ieo-campus.it</a>&gt;</span> wrote:<br>



<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">Hi Curtis and Rubén,<br>
<div><br>
On Dec 8, 2010, at 5:51 PM, Curtis Rueden wrote:<br>
<br>
&gt; Alessandro wrote:<br>
&gt; Does it make sense to add a level of redundancy like, for example, one in ten files has to carry the complete headers, in order to avoid the loss of metadata info if the master file got deleted/corrupted/abducted by aliens ?<br>




&gt;<br>
&gt; For large numbers of files, I think any mandated level of redundancy will still result in an undesirable increase in size.<br>
<br>
</div>Based on your experience how much increase in size we could expect from a &quot;one in ten&quot;, or &quot;one in hundred&quot; files with metatada redundancy ? I think that some estimations would be of great help in order to better  understand what could be the impact of this implementation on the IT Departments and HCS Facilities operations.<br>




<br>
Sorry if I ask this kind of obvious questions, but in Q1 2011 we will setup an HCS Facility here at our Campus and I&#39;ll be the person that has to deploy the IT infrastructure (storage/HPC) needed to run the Facility, OMERO will be playing a key role in this scenario, so I&#39;m basically learning here in preparation of the deployment.<br>




<br>
Thanks for your time and kind understanding,<br>
<font color="#888888"><br>
Alessandro<br>
</font><div><div></div><div><br>
&gt;<br>
&gt; -Curtis<br>
&gt;<br>
&gt; On Wed, Dec 8, 2010 at 9:00 AM, Alessandro Dellavedova &lt;<a href="mailto:alessandro.dellavedova@ifom-ieo-campus.it" target="_blank">alessandro.dellavedova@ifom-ieo-campus.it</a>&gt; wrote:<br>
&gt; Hi Rubén and list,<br>
&gt;<br>
&gt; &gt; Some options to simplify the format have ben discussed as follows:<br>
&gt; &gt;<br>
&gt; &gt;  - The master/slave approach. All files will reference the one that contains the complete headers.<br>
&gt;<br>
&gt; Does it make sense to add a level of redundancy like, for example, one in ten files has to carry the complete headers, in order to avoid the loss of metadata info if the master file got deleted/corrupted/abducted by aliens ?<br>




&gt;<br>
&gt; Best,<br>
&gt;<br>
&gt; Alessandro<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; ome-devel mailing list<br>
&gt; <a href="mailto:ome-devel@lists.openmicroscopy.org.uk" target="_blank">ome-devel@lists.openmicroscopy.org.uk</a><br>
&gt; <a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a><br>
&gt;<br>
&gt; On Wed, Dec 8, 2010 at 6:58 AM, Rubén Muńoz &lt;<a href="mailto:ruben.munoz@embl.de" target="_blank">ruben.munoz@embl.de</a>&gt; wrote:<br>
&gt; Hi Andrew and list subscribers,<br>
&gt;<br>
&gt; I have some comments to add regarding the OME.TIFF and OME.XML requirements for changes. The current description of our issue is:<br>
&gt;<br>
&gt; * EMBL Screening (Ruben Muńoz, Jan Ellenberg)<br>
&gt;<br>
&gt;         * Not duplicating XML for each field, _plane_, etc.<br>
&gt; I would like to add that our use case, will apply to each user of the OME.TIF multi-file export option.<br>
&gt;<br>
&gt; We previously pointed out that the number of planes that are stored per OME-TIFF has a big impact in each file&#39;s size. For multi-file datasets, the conversion output will be exponentially bigger than the raw data.<br>




&gt;<br>
&gt; At EMBL-Heidelberg HCS Facility, we have used this as internal standard, with the pre-requisite of having one single plane per file.<br>
&gt; The reasons to do that can be summarized:  gives maximum compatibility with software for image processing, online control of the microscope and visualization, even after instrument/power failure. This software includes in-house developments: CellCognition, Micropilot, Cellbase and 3rd-party projects: CellProfiler, Image J/FIJI.<br>




&gt;<br>
&gt; Given this scenario we found OME.TIF convenient because it has the correct conversion tools and an evolving metadata structure, in addition the commercial adoption of the format is growing.<br>
&gt;<br>
&gt; In the practice, a lot of the metadata consist in &quot;&lt;Plate&gt;&quot;, &quot;&lt;Image&gt;&quot; and &quot;&lt;Pixel&gt;&quot; elements (describing the SPW, dimensionally and the references to the files in the set).<br>




&gt;<br>
&gt; That can be prohibitive at the processing and the storage stage.<br>
&gt; Some options to simplify the format have ben discussed as follows:<br>
&gt;<br>
&gt;  - The master/slave approach. All files will reference the one that contains the complete headers.<br>
&gt;  - &quot;&lt;Plate&gt;&quot;, &quot;&lt;Image&gt;&quot; and &quot;&lt;Pixel&gt;&quot; elements could be grouped when similar (e.g. reg. expressions following a pattern)<br>
&gt;  - The &quot;&lt;Plate&gt;&quot;, &quot;&lt;Image&gt;&quot; and &quot;&lt;Pixel&gt;&quot;  could be extracted to a separate file.<br>
&gt;<br>
&gt; The first alternative was supported by Andrew. I suggested the second, but the project philosophy is opposite to the third.<br>
&gt;<br>
&gt; Are there other suggestions? I would like to keep this discussion open and to help to define more details if needed.<br>
&gt;<br>
&gt; Best,<br>
&gt; Rubén<br>
&gt;<br>
&gt; On Dec 7, 2010, at 4:03 PM, <a href="mailto:ome-devel-request@lists.openmicroscopy.org.uk" target="_blank">ome-devel-request@lists.openmicroscopy.org.uk</a> wrote:<br>
&gt;&gt;<br>
&gt;&gt; Date: Tue, 7 Dec 2010 13:07:49 +0000<br>
&gt;&gt; From: Andrew Patterson &lt;<a href="mailto:ajpatterson@lifesci.dundee.ac.uk" target="_blank">ajpatterson@lifesci.dundee.ac.uk</a>&gt;<br>
&gt;&gt; To: <a href="mailto:ome-devel@lists.openmicroscopy.org.uk" target="_blank">ome-devel@lists.openmicroscopy.org.uk</a>,<br>
&gt;&gt;      <a href="mailto:ome-users@lists.openmicroscopy.org.uk" target="_blank">ome-users@lists.openmicroscopy.org.uk</a><br>
&gt;&gt; Subject: [ome-devel] OME-XML Updates<br>
&gt;&gt; Message-ID:<br>
&gt;&gt;      &lt;<a href="mailto:B5B2766B-2357-40C1-B1DD-06CCEC3A62C9@lifesci.dundee.ac.uk" target="_blank">B5B2766B-2357-40C1-B1DD-06CCEC3A62C9@lifesci.dundee.ac.uk</a>&gt;<br>
&gt;&gt; Content-Type: text/plain; charset=us-ascii<br>
&gt;&gt;<br>
&gt;&gt; Hello OME-XML &amp; OME-TIFF users and potential users,<br>
&gt;&gt;<br>
&gt;&gt; We are in the process of compiling requirements for changes to the way our OME-XML and OME-TIFF formats work. This is in response to the new ways people are wanting to use our formats, and drawbacks they have come across when storing datasets in certain circumstances.<br>




&gt;&gt;<br>
&gt;&gt; Examples we have so far include:<br>
&gt;&gt; * storing large datasets, one plane per OME-TIFF: this is a valid way to want to store data, but one which at the moment causes metadata duplication on disk.<br>
&gt;&gt; * creating a &#39;lite&#39; OME-TIFF for display or to pass to external applications.<br>
&gt;&gt;<br>
&gt;&gt; A full list of our current thoughts is on the requirement ticket:<br>
&gt;&gt; <a href="http://trac.openmicroscopy.org.uk/omero/ticket/3535" target="_blank">http://trac.openmicroscopy.org.uk/omero/ticket/3535</a><br>
&gt;&gt;<br>
&gt;&gt; Some of these changes may effect key features of our formats, e.g. our current insistence that all matadata is stored in the same file as the image data.<br>
&gt;&gt;<br>
&gt;&gt; We would really like to have your input on this feature, or any others.<br>
&gt;&gt;<br>
&gt;&gt; If you have a use case that you think would help guide out future work we would love to hear from you. If you can reply on either of the mailing lists (OME-USER or OME-DEVEL), it will let others see and join in!<br>




&gt;&gt;<br>
&gt;&gt; Thanks again for your help and support.<br>
&gt;&gt;<br>
&gt;&gt; Cheers,<br>
&gt;&gt;<br>
&gt;&gt; Andrew<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Andrew Patterson<br>
&gt;&gt; <a href="mailto:ajpatterson@lifesci.dundee.ac.uk" target="_blank">ajpatterson@lifesci.dundee.ac.uk</a><br>
&gt;&gt; Software Developer, Open Microscopy Environment<br>
&gt;&gt; Wellcome Trust Centre for Gene Regulation &amp; Expression, University of Dundee<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; ome-devel mailing list<br>
&gt; <a href="mailto:ome-devel@lists.openmicroscopy.org.uk" target="_blank">ome-devel@lists.openmicroscopy.org.uk</a><br>
&gt; <a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
<br>
</div></div></blockquote></div><br>